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(&5~ ^ ^ f . PCT/FR97/00214 

TRAITE DE COOPERATION EN MATIERE DE BREVETS 



Expediteur: le BUREAU INTERNATIONAL 



PCT 



NOTIFICATION CONCERNANT LA 
TRANSMISSION DE DOCUMENTS 



Date d'expedrtion (jour/mois/annee) 

02 decembre 1998 (02.12,98) 



Demande Internationale no 
PCT/FR97/00214 



Destinataire: 



United States Patent and Trademark 
Office 

(Box PCT) ? 
Crystal Plaza 2 
Washington, DC 20231 
ETATS-UNIS D'AMERIQUE 

en sa qua lite d'office elu 



Date du depot international 

03 fevrier 1997 (03.02.97) 



Deposant 

SANOFI etc 



Le Bureau international transmet ci-joint le nombre de copies indique ci-apres des documents suivants: 

copie de la traduction en langue anglaise du rapport d'examen preliminaire international (article 36.3)a)) 



Bureau international de TOM PI 
34, chemin des Colombettes 
121 1 Geneve 20, Suisse 



no de telecopieur: (41-22) 740.14.35 



Fonctionnaire autorise 

Marc Salzman 

no de telephone: (41-22) 338.83.38 



Formulaire PCT/IB/310 (juillet 1992) 



002372926 
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PCT/FR97/00214 

TRAITE f COOPERATION EN MATIER JE BREVETS 



Expediteur: le BUREAU INTERNATIONAL 



rL 1 

NU I INLA 1 1UN □ tl_tu 1 IUN 

(regie 61.2 du PCT) 


Destinataire: 

uniteo otates ratent ano i raaemarK 

Office 

(Box PCT) 

Crystal Plaza 2 

Washington, DC 20231 

ETATS-UNIS D'AMERIQUE 

en sa qualite d'office elu 


Date d'expedrtion (jour/mo is/an nee) 
05 novembre 1998 (05.11.98) 




Demande internationale no 
PCT/FR97/00214 


Reference du dossier du deposant ou du mandataire 
BET 96/976 


Date du depot international (jour/mois/annee) 
03 fevrier 1997 (03.02.97) 


Date de priorrte (jour/mois/annee) 
02 fevrier 1996 (02.02.96) 


Deposant 

CAPUT, Daniel etc 



1 . L'office designe est avise de son election qui a ete faite: 

| X | dans la demande d'examen preliminaire international presentee a I'administration chargee de I'examen preliminaire 
international le: 

11 aout 1997 (11.08.97) 



| | dans une declaration visant une election ulterieure deposee aupres du Bureau international le: 



2. Selection [Xj a ete faite 

| | n'a pas ete faite 

avant ('expiration d'un delai de 19 mois a compter de la date de priorite ou, lorsque la regie 32 s'applique, dans le delai vise 
a la regie 32.2b). 





Fonctionnaire autorise 


Bureau international de I'OMPI 




34, chemin des Colombettes 


Beate Giffo-Schmitt 


121 1 Geneve 20, Suisse 




no de telecopies: (41-22) 740.14.35 


no de telephone: (41-22) 338.83.38 



Formulaire PCT/IB/331 (juillet 1992) 2323673 
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AMENDED CLAIMS _ 
hATENT COOPERATION TREATY 



From the INTERNATIONAL BUREAU 



PCT 


To: 


COMMUNICATION OF 


United States Patent and Trademark 


INTERNATIONAL APPLICATIONS 


Office 




(Box PCT) 


(PCT Article 20) 


Crystal Plaza 2 




Washington, DC 20231 




ETATS-UNIS D'AMERIQUE 


Date of mailing: 






09 October 1997 (09.10.97) 




in its capacity as designated Office 



The International Bureau transmits herewith copies of the international applications having the following international application 
numbers and international publication numbers: 

International application no.: International publication no.: 



PCT/FR97/0021 4 W097/281 86 



The International Bureau of WIPO 


Authorized officer: 


34, chemin des Colombettes 




1211 Geneva 20. Switzerland 


J. Zahra 


Facsimile No.: (41-22) 740.14.35 


Telephone No.: (41-22)338.83.38 



Form PCT/IB/349 (July 1992) 1711156 



Jl 
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TRAITE ^ COOPERATION EN MATlEi DE BREVETS 



WO 97/28186 
PCT/FR97/00214 



Expediteur: le BUREAU INTERNATIONAL 



PCT 



AVIS INFORMANT LE DEPOSANT DE LA 
COMMUNICATION DE LA DEMANDE 
INTERNATIONALE AUX OFFICES DESIGNES 

(regie 47. 1.c), premiere phrase, du PCT) 



Date d'expedition (jour/mois/annee) 
09 octobre 1997 (09.10.97) 



Destinataire: 



LE GUEN, Gerard 

Cabinet Lavoix 

2, place d'Estienne-d'Orves 

F-75441 Paris Cedex 09 

FRANCE 



Reference du dossier du deposant ou du man data ire 
BET 96/976 


AVIS IMPORTANT 


Demande Internationale no 
PCT/FR97/00214 


Date du depot international (jour/mois/annee) 
03 fevrier 1997 (03.02.97) 


Date de priorite (jour/mois/annee) 
02 fSvrier 1996 (02.02.96) 


Deposant 

SANOFI etc 



1. II est notifie par la presente qu'a la date indiquee ci-dessus comme date d'expedition de cet avis, le Bureau international a 
communique, comme le prevoit ('article 20, la demande Internationale aux offices designes suivants: 

AU,BR^AmEPJLJP,KP,KR,NO,PL,SK,US 

Conformement a la regie 47.1.c), troisieme phrase, ces offices acceptent le present avis comme preuve determinante 
du fait que la communication de la demande Internationale a bien eu lieu a la date d'expedition indiquee plus haut, et le 
deposant n'est pas tenu de remettre de copie de la demande Internationale a r office ou aux offices designes. 

2. Les offices designes suivants ont renonce a I'exigence selon laquelle cette communication doit etre effectu^e a cette date: 

AUAM^^AT^BA^BB^G^YXH^U^Z^E^K^EA^EE^S^FLGB^G^HUJS^E^G^KZ^C^K, 

LR^S,LT,LU,LV,MD,MG,MK,MN,MW,MX,NZ^ 

VN,YU 

La communication sera effectuee seulement sur demande de ces offices. De plus, le deposant n est pas tenu de remettre 
de copie de la demande Internationale aux offices en question (regie 49.1 )a-bis)). 

3. Le present avis est accompagne d'une copie de la demande internationale publiee par le Bureau international le 
07 aout 1997 (07.08.97) sous le numero WO 97/28186 

RAPPEL CONCERNANT LE CHAPITRE II (article 31.2)a) et regie 54.2) 

Si le deposant souhaite reporter Touverture de la phase nationale jusqu'a 30 mois (ou plus pour ce qui concerne certains 
offices) a compter de la date de priorite, la demande d'examen preliminaire international doit etre presentee a" 
I'administration competence chargee de I'examen preliminaire international avant I'expiration d'un delai de 19 mois a 
compter de ta date de priority. 

II appartient exclusivement au deposant de veiller au respect du delai de 19 mois. 

II est a noter que seul un deposant qui est ressortissant d'un Etat contractant du PCT tie par te chapitre 11 ou qui y a son 
domicile peut presenter une demande d'examen preliminaire international. 

RAPPEL CONCERNANT L'OUVERTURE DE LA PHASE NATIONALE (article 22 ou 39.1)) 

Si le deposant souhaite que la demande internationale procede en phase nationale. il doit, dans le delai de 20 mois ou 
de 30 mois, ou plus pour ce qui concerne certains offices, accomplir les actes mentionnes dans ces dispositions aupres 
de chaque office designe ou elu. 

Pour d'autres informations importantes concernant les detais et les actes a accomplir pour I'ouverture de la phase 
nationale, voir ('annexe du formulaire PCT/IB/301 (Notification de la reception de I'exemplaire original) et le volume II 
du Guide du deposant du PCT. 





Fonctionnaire autorise 


Bureau international de I'OMPI 


34, chemin des Colombettes 


J. Zahra 


1211 Geneve 20, Suisse 




no de telecopies (41-22) 740.14.35 


no de telephone (41 -22) 338.83.38 


Formulaire PCT/IB/308 (juillet 1996) 


1711138 



Jh 



THIS PAGE BLANK (uspto) 



TRAIT!; DJ^Ub OPERATION. EN MATIERE Jj^REVK iS 

PCT 



RAPPORT DE RECHERCHE INTERNATIONALE 
(article 1 8 et regies 43 et 44 du PCT) 



Reference du dossier du dcposant ou 
du m and at aire 

BET 96/976 


Dri , ,n vi iixit voir la notification de tran 
POUK MJI 1 1, (formulaire pcT/ISA/220) 

A CONNER 


emission du rapport de recherche Internationale 
et, le cas echeant, le point 5 ci-apres 


Demande intern ationalc n" 

PCT/ FR 97/ 00214 


Date du depot international^^r/motr/an*^ 

03/02/1997 


(Date de priorite (la plus ancienne) 
(jourfmois/annee) 

02/02/1996 


Dcposant 

SANOFI et al. 





Le present rapport de recherche Internationale, etabli par .'administration charge de £ recherche Internationale, est transmis au 
dfpos^t corXrmemcnt a l'article 18. Une copie en est transm.se au Bureau .nternational. 

Ce rapport de recherche internationale comprend 6 feuilles. 

Q7] II est aussi accompagne d'une copie de chaque document relatif a 1'etat de la technique qui y est cite. 

1 . Q II a ete estime que ccrtaines rcvendications „e pouvaicnt pas faire I'objet d'une recherche (voir le cadre I). 
1. Q II y a absence iTunite de I'invention (voir le cadre II). 

3 171 La demande internationale contient la divulgation d'un Bstage de sequence de nucleotides ou d'acides amines et la 
W rohcr™he internationale a ete eflectuee sur la base du hstage de sequence 
[ y | depose avec la demande internationale 

| | fourni par le deposant separement de la demande internationale 
□ 

qu elle a ete deposee. 



sans etre accompagnee d'une declaration selon laquelle il n'inclut pas d'elements 
allant au-dela de la divulgation faite dans la demande Internationale telle 



| [ transcrit par radministration 

4. En cc qui conccrnc le titre,[x] ^ tcxte est approuve tel qu'il a ete remise par le deposant 

| [ Le texte a ete etabli par 1'administration et a la teneur suivante: 



5. En ce qui concerne I'abrcge, 



Je texte est approuve tel qu'il a ete remis par le deposant 

□ le texte freoroduit dans le cadre III) a ete etabli par 1'administration conformemcnt a la 
recfe 38 2b^U dcposant peut presenter des observations a 1'administration dans un delai 



6. La figure des dessins a publier avec l'abrege est la suivante: 
Figure n* □ suggeree par le deposant.. 



| | parce que le deposant n'a pas suggere de figure. 
[ ] parce que cette figure caracterise mieux I'invention. 



[)(] Aucune des figures 
n'est a publier. 



Formulaire PCT/ISA/210 (premiere feuille) (juillet 1992) 



4 
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RAPPORT DE REfltfERCHE INTERNATIONALE 



le Internationale No 

FR 97/00214 



A. CLASSEMENT DE L'OBJET DE LA DEMANDE „ 

CIB 6 C07K14/47 C12N15/12 C12Q1/68 



A61K39/395 G01N33/68 



Selon la classification Internationale des brevets (CIB) ou a la fois selon la classification nationale et la CIB 



B. DOMAINES SUR L ESQ U ELS LA RECHERCHE A PORTE 



Documentation mini male consultee (systeme de classification suivi des symboles de classement) 

CIB 6 C07K A61K C12N C12Q G01N 



Documentation consultee autre que la documentation mini male dans la mesure ou ces documents relevent des domaines sur lesquels a porte la recherche 



Base de donnees electronique consultee au cours de la recherche intemationale (nom de la base de donnees, et si cela est realisable, termes de recherche 
utilises) 



C. DOCUMENTS CONSIDERES COMME PERTINENTS 



Cattgorie * Identification des documents cites, avec, le cas echeant, l'indication des passages pertinents 



no. des revendications visees 



-/- 



j x| Voir la suite du cadre C pour la fin de la liste des documents 



0 



Les documents de families de brevets sont indiques en annexe 



' Categories sped ales de documents cites: 

'A* document definissant l'etat general de la technique, non 

considere comme particulierement pertinent 
"E" document anterieur, mais publie a la date de depot international 

ou apres cette date 
"L" document pouvant jeter un doute sur une re vendi cation de 

priori te ou cite pour determiner la date de publication d'une 

autre citation ou pour une raison speciale (telle qu'indiquee) 
"O* document se refer ant a une divulgation orale, a un usage, a 

une exposition ou tous autres moyens 
*P* document publie avant la date de depdt international, mais 

posterieurement a la date de priori te revendiquee 



"T" document ulterieur publie apres la date de depot international ou la 
date de priori te et n'appartenenant pas a l'etat de la 
technique pertinent, mais cite pour comprendre le principe 
ou la theorie constituant la base de l'invention 



document particulierement pertinent; l'invention revendiquee ne peut 
etre consideree comme nouvelle ou comme impli quant une activite 
inventive par rapport au document considere isolement 
document particulierement pertinent; l'invention revendiquee 
ne peut fitre consideree comme impli quant une activitt inventive 
lorsque le document est associe a un ou plusieurs autres 
documents de mfime nature, cette combinaison etant evidente 
pour une personne du metier 

document qui fait partie de la mfime famille de brevets 



Date a laquelle la recherche intemationale a etc eflectivement achevee 



12 Juin 1997 



Date d'expedition du present rapport de recherche intemationale 

3 0. 06. 9? 



Nom et adresse postale de 1' administration chargee de la recherche international e 
Office Europeen des Brevets, P.B. 5818 Patentlaan 2 
NL - 2280 HV Rijswijk 
Tel. ( + 31-70) 340-2040, Tx. 31 651 epo nl, 
Fax: ( + 31-70) 340-3016 



Fonctionnaire autorise 



Gac, G 



FormuJaire PCT/IS A/210 (deuxieme feuille) (juillet 1993) 
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RAPPORT DE REflHERCHE INTERNATIONALE 



Internationale No 

FR 97/00214 



C(suite) DOCUMENTS CONSIDERES COMME PERTINENTS 



Categoric ' 



Identification des documents cites, avec, le cas echeant, l'indication des passages pertinents 



no. des re vendi cations visees 



A 
X 

A 
X 
A 



SCIENCE, 

vol. 237, 1987, 

pages 1620-1624, XP000604718 

BODRUG: "Molecular analysis of a 

constitutional X-autosome translocation in 

a female with muscular dystrophy" 

voir page 1622; figure 4 

& DATABASE STRAND 

ref. EMHUM hsrtmdl, AN: L08092 

6 Avril 1993 

voir sequence 

& J. MOL. BIOL., 

vol. 232, no. 1, 1993, 

pages 314-321, XP000604618 

MC NAUGHTON ET AL. : "A cluster of 

transposon-1 i ke repetitive sequences in 

intron 7 of the human dystrophin gene" 

voir le document en entier 



NUCLEIC ACID RESEARCH, 
vol. 16, no. 23, 1988, 
page 1183 XP002014924 

SOUSSI ET AL.: "Nucleotide sequence of a 
cDNA encoding the chicken p53 nuclear 
protein" 

voir le document en entier 



& DATABASE STRAND 
ref. Swissprot: P53-chick 
1 Mars 1989 
voir sequence 



AN : P10360 



WO 94 01563 A (ENERGY BIOSYSTEMS 
CORPORATION) 20 Janvier 1994 
voir sequence nA 1 



& DATABASE STRAND 

ref. Pat-SA93-D: SA77122 

voir sequence nA 1 



-/- 



13,14 



13,14, 
16,17 



22,23 
13,14 



18,22,23 
13,14 



1-9, 

13-17,25 
13,14 



1-9, 
13-17 

13,14 



16,17, 
22,23 



3 
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RAPPORT DE R 



ERCHE INTERNATIONALE 



le Internationale No 

FR 97/00214 



C(suite) DOCUMENTS CONSIDERES COMME PERTINENTS 



Cat* gone * Identification des documents cites, avec, le cas echeant, 1 'indication des passages pertinents 



no. des re vendi cations visees 



BIOCHEM. BIOPHYS. RES. COMMUN., 

vol. 194, no. 2, 30 Juillet 1993, 

pages 698-705, XP002014925 

IWASE ET AL. : "Identification of 

protein- tyrosine kinase genes 

preferentially expressed in embryo stomach 

and gastric cancer" 

voir page 700; figure 1 

& DATABASE STRAND 

ref. EMHUM1: Hserklp, AN: D37827 

16 Aout 1994 

voir sequence 

EP 0 377 295 A (ELI LILLY AND COMPANY) 11 

Juillet 1990 

voir page 6 

& DATABASE STRAND 

ref. Tpsd-D: 108282, AN: 108282 

18 Fevrier 1995 

voir sequence 

DATABASE STRAND 

ref. EN960713, AN: Z75711 

XP002014926 

voir sequence 

& NATURE, 

vol. 368, 1994, 

pages 32-38, 

WILSON ET AL.: "2.2. Mb of contiguous 
nucleotide sequence from chromosome III of 
C. elegans" 

FR 2 692 594 A (PEREZ J-C.) 24 Decembre 
1993 

& DATABASE GENESEQ 
AN=Q55626, 12 Juillet 1994 
XP002014927 

voir alignement des sequences 

WO 94 08241 A (DEUTSCHES 
KREBSFORCHUNGSZENTRUM STIFTUNG DES 
OFFENTLICHES RECHTS) 14 Avri 1 1994 
voir le document en entier 



-/-- 



13,14 



13,14 



13,14 



13,14 



13,14 



1-12, 
15-36 



3 
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RAPPORT DE RE^pRCHE INTERNATIONALE 



Pf 7 

PCT/ 



C(suite) DOCUMENTS CONSIDERES COMME PERTINENTS 



Le Internationale No 

T/FR 97/G0214 



Categone * 



Identification des documents cites, avec, le cas echeant, 1' indication des passages pertinents 



no. des re vendi cations visees 



MOL. CELL. BIOL., 

vol. 6, no. 9, Septembre 1986, 

pages 3232-3239, XPO006O4639 

ARAI ET AL.: " Immunologically distinct 

p53 molecules generated by alternative 

splicing" 

voir le document en entier 

& DATABASE STRAND 
ref. Pir2: S38822 
13 Janvier 1995 
voir sequence 

NATURE GENETICS, 

vol. 6, no. 4, Avril 1994, 

pages 357-362, XP000604628 

NEUMANN ET AL.: "Multifactorial 

inheritance of neural tube defects : 

localization of the major gene and 

recognition of modifiers in ct mutant 

genes" 

voir le document en entier 

DATABASE EMBL 

ID: CEF26F12, AC= U55373, 

XP002032930 

voir alignements des sequences 

& NATURE, 

vol. 368, 1994, 

pages 32-38, 

WILSON ET AL.: "2.2 Mb of contiguous 
nucleotide sequence from chromosome III of 
C. elegans" 

DATABASE EMBL 

ID=AC= S77819, 29 Septembre 1995 
XP002032931 

voir alignements des sequences 

& CANCER LETTERS, 

vol. 92, no. 2, 8 Juin 1995, 

pages 181-186, XP00O674693 

KRAEGEL ET AL. : "Sequence analysis of 

canine p53 in the region of exons 3-8" 

-/" 



13,14 



3,4 



13,17, 
22,23 



13,14 



16 



13,14 



3 
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RAPPORT DE R 



RCHE INTERNATIONALE 



: Internationale No 

PC1/FR 97/00214 



C^sirite) DOCUMENTS CONSIDERES COMME PERTINENTS 



Categone ' 



Identification des documents cites, avec, le cas echeant, l'indication des passages pertinents 



no. des re vendi cations visees 



DATABASE EMBL 

ID: SIP53, AC=M75145, 24 Aout 1991 
XP0O2O32932 

voir alignements des sequences 
& GENE, 

vol. 112, 1992, 
pages 241-245, 

DE FROMENTEL ET AL.: "Rainbow trout p53: 
cDNA cloning and biochemical 
characteri zati on " 
voir le document en entier 

DATABASE EMBL 

ID: BTP53, AC= X81704, 14 Decembre 1994 
XP002032933 

voir alignements des sequences 

& DNA SEQ., 

vol. 5, no. 4, 1995, 

pages 261-264, XP000674685 

DESQUIEDT ET AL.: "Nucleotide sequence of 

bovine p53 tumor-suppressor cDNA" 

voir le document en entier 

NUCLEIC ACIDS RES., 

vol. 20, no. 8, 1992, 

pages 1879-1882, XP002032929 

GRYAZNOV ET AL. : "Selective 

O-phosphiti lation with nucleoside 

phosphoramidite reagents" 

voir page 1880 

INT. J. RAD I AT. BIOL. RELAT. STUD. PHYS. , 

CHEM. MED., 

vol. 51, no. 3, 1987, 

pages 429-439, XPO00674638 

TEOULE ET AL.: "Gamma-irradiation of 

homodeoxyol igonucleotides 32P-labelled at 

one end : computer simulation of the chain 

length distribution of the radioactive 

fragments" 

voir page 426 



13,14 



13,14 



18 



18 



3 
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INT^JjATIONAL SEARCH REPORT 

InfoSation on patent family members 



Itional Application No 

PCT/FR 97/00214 



Patent document 
cited in search report 


Publication 
date 


Patent family 
member(s) 


Publication 
date 


WO 9401563 A 


on A1 OA 


AU 


4671893 


A 


oi _ni _QA 




CA 


2139876 


A 


on.ni _q/i 

tU Ul 






CN 


1085254 


A 








EP 


0651808 


A 


10-05-95 






JP 


7507691 


T 


31-08-95 






NO 


950081 


A 


09-03-95 






US 


5356801 


A 


18-10-94 






US 


5578478 


A 


26-11-96 



EP 377295 



11-07-90 



AT 


118042 


T 


15 


-02 


-95 


AU 


622253 


B 


02 


-04 


-92 


AU 


4709889 


A 


28 


-06 


-90 


CA 


2005649 


A 


22 


-06 


-90 


DE 


68920987 


D 


16 


-03 


-95 


DE 


68920987 


T 


22 


-06 


-95 


ES 


2067556 


T 


01 


-04 


-95 


HU 


208713 


B 


28 


-12 


-93 


JP 


2227082 


A 


10 


-09 


-90 



FR 2692594 


A 


24-12-93 


NONE 






W0 9408241 


A 


14-04-94 


EP 0614531 
JP 7501711 


A 

T 


14-09-94 
23-02-95 
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ORGANISATION MONDIALE DE LA PROPRIETE INTELLECTUELLE 
Bureau international 




PCT 

DEMANDE INTERNATIONALE PUBLIEE EN VERTU DU TRATTE DE COOPERATION EN MATTERE DE BREVETS (PCT) 



(51} Classificati n Internationale des brevets 6 : 

C07K 14/47, C12N 15/12, C12Q 1/68, 
A61K 39/395, G01N 33/68 



Al 



(11) Nume>o de publication Internationale: WO 97/28186 
(43) Date de publication internationale: 7 aout 1997 (07.08.97) 



(21) Numero de la demande internationale: PCT/FR97/00214 

(22) Date de de*pot international: 3 fevrier 1997 (03.02.97) 



(30) Donn&s relatives a la priority : 

|9^/01309 2 fevrier 1996 (02.02.96) 



FR 



(71) Deposant (pour tous les Etats designis sauf US): SANOFI 

[FR/FR]; 32-34, rue Marbeuf, F-75008 Paris (FR). 

(72) Inventeurs; et 

(75) Inventeurs/De*posants (US settlement): CAPUT, Daniel 
[FR/FR]; La Bousquiere, F-31290 Avignonet-Lauragais 
(FR). FERRARA, Pascual [AR/FR]; Libouille Saint- 
Assiscle, F-31290 Avignonet-Lauragais (FR). KAGHAD, 
Ahmed, Mourad [FR/FR]; 5, rue de la Poste, F-31450 
Montgiscard (FR). 

(74) Mandataire: LE GUEN, G6rard; Cabinet Lavoix, 2, place 
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"Prot§in6 purifjge SR-p70" . 
L'invention conceme de nouvelles sequences d'acides nucleiques de la famille des 
genes suppresseurs de tumeurs apparentee avec le gene de la proteine p53, et les 
sequences proteiques correspondantes. 

L'invention concerne egalement les applications prophylactiques. therapeutiques et 
diagnostiques de celles-ci t notamment dans le domaine des pathologies liees aux 
phenomenes d'apoptose ou de transformation cellulaire. 

Les genes suppresseurs de tumeurs jouent un role clef dans la protection contre les 
phenomenes de cancerisation, et toute modification susceptible d'entramer la perte 
de I'un de ces genes, son inactivation ou son dysfonctionnement, peut avoir un 
caractere oncogene, creant ainsi des conditions favorables au developpement d'un 
cancer. 

Les auteurs de ia presente invention ont identifie les produits de transcription d un 
nouveau gene ainsi que les proteines correspondantes. Ce gene SR-p70 est 
apparente au gene suppresseur de tumeur p53, dont I'activite anti-tumorale est Itee a 
son activite de facteur de transcription et plus specifiquement aux controles exerces 
sur I'activite des genes Bax et Bcl-2, instrumentaux dans les mecanismes de mort 
cellulaire. 

La presente invention est done relative a des proteines purifiees SR-p70, ou des 
fragments biologiquement actifs de celles-ci. 

L'invention conceme egalement des sequences d'acides nucleiques isolees codant 
pour lesdites proteines ou leurs fragments biologiquement actifs et des 
oligonucleotides specifiques obtenues a partir de ces sequences. 
Elle vise en outre les vecteurs de clonage et/ou d'expression contenant au moins 
I'une des sequences nucleotidiques definies ci-dessus, et les cellules notes transfec- 
tees par ces vecteurs de clonage et/ou d'expression dans des conditions permettant 
la replication et/ou I'expression de I'une desdites sequences nucleotidiques. 
Les methodes de production de proteines recombinantes SR-p70 ou de leurs frag- 
ments biologiquement actifs par les cellules hotes transferees font egalement partie 
de Pinverition. 

L'invention comprend egalement des anticorps ou des derives d'anticorps specifiques 
des proteines definies ci-dessus. 

Elle vise en outre des methodes de detection des cancers, soit par la mesure de 
('accumulation des proteines SR-p70 dans les tumeurs selon des techniques 
d'immuno-histochimie, soit par la mis en evidence dans le serum de patients 
d'auto-anticorps diriges contr ces proteines. 
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L. nvent.cn concerne egalement tout .nhibiteur ou activateur de I'activite d„ *p 7n 
Par exemp,e interaction proteine-proteine faisant ,ntervenir ,e S R ! p T ' 
Elle concerne aussi des sequences oligonucleotidiques antisens SD ~r 

que par exemple des vecteurs v.raux inactives capables de tran.** 
des sequences mdantae « <-<=M«jDies ae transferer 

a) la sequence SEQ ID n° 2 ; 

b) la sequence SEQ ID n° 4 ; 

c) la sequence SEQ ID n° 6 ; 

d) la sequence SEQ ID n° 8 ; 

e) la sequence SEQ ID n° 10 ; 
0 la sequence SEQ ID n° 13 ; 

g) la sequence SEQ ID n° 15 ; 

h) la sequence SEQ ID n° 17 ; 
0 la sequence SEQ ID n° 19 * 

Dans la desertion de rinvenSon, on utilise les definitions suivantes • 

SEQ ID „• ,0. SEQ °o nM3 SEQ ID • 5 sIqTd" • \l ^ ^ * **> '° * 

<0 n.' T7m ^ P °' yPeP,lde d9 ^ Ue "" SEQ ° « SEQ 

SEQ ID n- 8. SEQ ID n- 10 . SEQ ,D n'13, SEQ ,D „" * £ " * SE ° '° * 
19 MM, ob, nue par mutaHon. d«e tt on. add! sl^ In J, °" *** '° 
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isoforme, c'est-a-dire une sequence identique a la sequence SEQ ID n° 2, SEQ ID 
n° 4, SEQ ID n° 6, SEQ ID n° 8, SEQ ID n° 10, SEQ ID n° 13, SEQ ID n° 15, SEQ ID 
n° 17 ou SEQ ID n° 19 a run de ses fragments ou sequences modifiees, contenant 
un ou plusieurs acides amines sous la forme d'enantiomere D, lesdites sequences 
variantes, modifiees ou isoformes ayant conserve au moins Tune des proprietes les 
rendant biologiquement actives. 

- biologiquement actif : capable de se lier a I'ADN et/ou d'exercer une activite de 
facteur de transcription et/ou de participer au controle du cycle cellulaire, de la 
differenciation et de I'apoptose et/ou capable d'etre reconnu par les anticorps 
specifiques du polypeptide de sequence SEQ ID n°2, SEQ ID n°4, SEQ ID n° 6, SEQ 
ID n° 8, SEQ ID n° 10, SEQ ID n°13. SEQ ID n° 15, SEQ ID n° 17 ou SEQ ID n° 19 
et/ou capable d'induire des anticorps qui reconnaissent ce polypeptide. 
La fabrication de derives peut avoir differents objectifs, dont en particulier celui 
d'augmenter i'affinite du polypeptide pour I'ADN ou son activite de facteur de 
transcription, ceiui d'ameliorer ses taux de production, d'augmenter sa resistance a 
des proteases, de modifier ses activites bioiogiques ou de lui conferer de nouvelles 
proprietes pharmaceutiques et/ou bioiogiques. 

Parmi les polypeptides de ('invention, on prefere le polypeptide d'origine humaine, 
comprenant la sequence SEQ ID n° 6, SEQ ID n° 13, SEQ ID n°15, SEQ ID n°17 ou 
SEQ ID n°19. Le polypeptide de 636 acides amines correspondant a la sequence 
SEQ ID n° 6 est identique a plus de 97 % au polypeptide de sequence SEQ ID n° 2. 
Le polypeptide de sequence SEQ ID n° 2 et celui de sequence SEQ ID n° 4 sont deux 
produits d'expression d'un meme gene, de meme pour les sequences SEQ ID n° 8 et 
SEQ ID n° 10 et pour les sequences SEQ ID n° 6, SEQ ID n°13, SEQ ID n° 15, SEQ 
IDn° 17 et SEQ ID n° 19. 

Comme il sera explique dans les exemples, le polypeptide de sequence SEQ ID n° 4 
correspond d une terminaison prematuree du peptide de sequence SEQ ID n° 2, liee 
a un epissage alternatif du transcript codant pour le polypeptide de SEQ ID n° 2 le 
plus long (ARN messager) du gene correspondant. De meme chez I'humain, les 
polypeptides correspondant aux sequences SEQ ID n° 6 t SEQ ID n° 13, SEQ ID n°15, 
SEQ ID n° 17 et SEQ ID n° 19 divergent dans leur composition au niveau des parties, 
N- et/ou -C terminates et ce consecutif a des epissages alternatifs d'un meme 
transcript primaire. La sequence peptidique N-terminale de la sequence SEQ ID n° 
1 0 est del ' t ' , c lie a un epissage alternatif d son transcript codant. 
Avantageusem nt, rinvention vise un polypeptide correspondant au domaine de 
fixation sur I'ADN de Tun des polypeptides precedents. 
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Ce domaine correspond a la sequence comprise entre le residu 110 et le residu 310 
pour tes sequences SEQ ID n° 2 ou 6, et entre le residu 60 et le residu 260 pour la 
sequence SEQ ID n° 8. 

La presente invention a egalement pour objet des sequences decides nucleiques 
codant pour une proteine SR-p70 ou des fragments ou derives de celle-ci 
biologiquement actifs. 

Plus preferentiellement, ('invention a pour objet une sequence d'acides nucleiques 
isolee choisie parmi : 

a) la sequence SEQ ID n° 1 ; 

b) la sequence SEQ ID n° 3 ; 

c) la sequence SEQ ID n° 5 ; 

d) la sequence SEQ ID n°7 ; 

e) la sequence SEQ ID n°9 ; 

f) la sequence SEQ ID n° 1 1 ; 

g) la sequence SEQ ID n° 12 ; 

h) la sequence SEQ ID n° 14 ; 

i) la sequence SEQ ID n° 16 ; 
j) la sequence SEQ ID n° 18 ; 

k) les sequences d'acides nucleiques capables de s'hybrider specifiquement a 
la sequence SEQ ID n° 1, SEQ ID n° 3, SEQ ID n* 5, SEQ ID n°7, SEQ ID n°9, 
SEQ ID n° 11, SEQ ID n° 12, SEQ 1 ID n°14 ou SEQ ID n° 16 ou SEQ ID n° 18 ou a 
leurs sequences complementaires, ou de s'hybrider specifiquement a leurs 
sequences proximales ; 

I) les sequences derivees des sequences a), b), c) ( d) t e), f). 9). h), i), j) ou k) du 
fait de la degenerescence du code genetique. 

Selon un mode de realisation prefere, Invention a pour objet les sequences 
nucleotidiques SEQ ID n° 5, SEQ ID n° 12, SEQ ID n° 14, SEQ ID n° 16 et SEQ ID n° 
18 correspondant respectivement aux ADNc des proteines humaines des sequences 
SEQ ID n° 6, SEQ ID n° 13, SEQ ID n° 15, SEQ ID n° 17 et SEQ ID n° 19. 
Les differentes sequences nucleotidiques de ('invention peuvent etre d'origine 
artificielle ou non. II peut s'agir de sequences d'ADN ou d'ARN, obtenues par criblage 
de banques de sequences au moyen de sondes elaborees sur la base des 
sequences SEQ ID n° 1, 3, 5, 7, 9, 11, 12, 14, 16 ou 18. De telles banques peuvent 
etre preparees par des techniques classiques de biologie moleculair , connues de 
I'homme de Tart. 
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Les sequences nucleotidiques selon ('invention peuvent egalement etre preparees par 
synthese chimique, ou encore par des methodes mixtes inciuant !a modification 
chimique ou enzymatique de sequences obtenues par criblage de banques. 
Ces sequences nucleotidiques permettent la realisation de sondes nucleotidiques, 
capables de s'hybrider fortement et specifiquement avec une sequence d'acides nu- 
cleiques, d'un ADN genomique ou d'un ARN messager, codant pour un polypeptide 
selon Tinvention ou un fragment biologiquement actif de celui-ci. De telles sondes font 
egalement partie de invention. Elles peuvent etre utilisees comme outil de diagnostic 
in vitro pour la detection, par des experiences d'hybridation, de transcripts specifiques 
des polypeptides de Tinvention dans des echantillons biologiques ou pour la mise en 
evidence de syntheses aberrantes ou d'anomalies genetiques telles que la perte 
d'heterozygotie ou le rearrangement genetique, resultant d'un polymorphisme, de 
mutations ou d'un epissage different. 

Les sondes de Tinvention comportent au minimum 10 nucleotides, et au maxknum 
comportent la totalite de la sequence du gene SR-p70 ou de son ADNc contenu par 
exemple dans un cosmide. 

Parmi les sondes les plus courtes, c'est-a-dire d'environ 10 a 20 nucleotides, les 
conditions d'hybridation appropriees correspondent aux conditions stringentes 
usuellement utilisees par Thomme de metier. 

La temperature utilisee est de preference comprise entre T m -5° C a T m -30° C, de 
preference encore entre T m -5° C et T m -10° C, T m etant la temperature de fusion, 
temperature a laquelle 50 % des brins d'ADN apparies se separent. 
L'hybridation est de preference menee dans des solutions a force ionique elevee, 
telles que notamment des solutions 6 x SSC. 

De maniere avantageuse, les conditions d'hybridation utilisees sont les suivantes : 

- temperature : 42° C t 

- tampon d'hybridation : 6 x SSC, 5 x Denharfs, 0,1 % SDS, 
telles que decrites dans I'exemple III. 

Avantageusement, ces sondes sont representees par les oligonucleotides suivants ou 
leurs complementaires : 

SEQ ID n° 20 : GCG AGC TGC CCT CGG AG 

SEQ ID n° 21 : GGT TCT GCA GGT GAC TCA G 

SEQ ID n° 22 : GCC ATG CCT GTC TAC AAG 

SEQ ID n° 23 : ACC AGC TGG TTG ACG GAG 

SEQ ID n° 24 : GTC A AC CAG CTG GTG GGC CAG 

SEQ ID n° 25 : GTG GAT CTC GGC CTC C 
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SEQ ID n° 26 : AGG CCG GCG TGG GGA AG 
SEQ ID n° 27 : CTT GGC GAT CTG GCA GTA G 
SEQ ID n° 28 : GCG GCC ACG ACC GTG AC 
SEQ ID n° 29 : GGC AGC TTG GGT CTC TGG 
SEQ ID n° 30 : CTG TAC GTC GGT GAC CCC 
SEQ ID n° 31 : TCA GTG GAT CTC GGC CTC . 
SEQ ID n° 32 : AGG GGA CGC AGC GAA ACC 
SEQ ID n° 33 : CCA TCA GCT CCA GGC TCT C 
SEQ ID n° 34 : CCA GGA CAG GCG CAG ATG 
SEQ ID n° 35 : GAT GAG GTG GCT GGC TGG A 
SEQ ID n° 36 : TGG TCA GGT TCT GCA GGT G 
SEQ ID n° 37 : CAC CTA CTC CAG GGA TGC 
SEQ ID n° 38 : AGG AAA ATA GAA GCG TCA GTC 
SEQ ID n° 39 : CAG GCC CAC TTG CCT GCC 
SEQ ID n° 40 : CTG TCC CCA AGC TGA TGA G 



Preferentiellement, les sondes de I'invention sont marquees, prealablement a leur 

utilisation. Pour cela, piusieurs techniques sont a la portee de I'homme du metier 

(marquage fluorescent, radioactif, chimioluminescent, enzymatique, etc). 

Les methodes de diagnostic in vitro dans lesquelles ces sondes nucleotidiques sont 

mises en oeuvre, sont incluses dans I'objet de la presente invention. 

Ces methodes concernent par exemple la detection de syntheses anormales (ex. 

accumulation de produits de transcription) ou d'anomalies genetiques, telles que la 

perte d'heterozygotie et le rearrangement genetique, et les mutations ponctuelles au 

niveau des sequences nucleotidiques d'acides nucleiques codant pour une proteine 

SR-p70, selon la definition donnee precedemment. 

Les sequences nucleotidiques de invention sont egalement utiles pour la fabrication 
et I'utilisation d'amorces oligonucleotidiques pour des reactions de sequencage ou 
d'amplification specifique selon la technique dite de PCR ou toute variante de celle-ci 
(Ligase Chain Reaction (LCR). ...). 

Des paires d'amorces preferees sont constitutes par des amorces choisies sur les 
sequences nucleotidiques : SEQ ID n° 1 : sequence de singe de 2 874 nucleotides et 
SEQ ID n°5 : ADNc SR-p70a humain, notamment en amont du codon ATG d'initiation 
et en aval du codon TGA d'arret de traduction. 

Avantageusem nt, ces amorces sont representees par les couples suivants: 
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- couple n 3 1 : 

amorce sens : GCG AGC TGC CCT CGG AG (SEQ ID r»° 20) 
amorce antisens : GGT TCT GCA GGT GAC TCA G (SEQ ID n° 21) 

- couple n°2 : 

amorce sens : GCC ATG CCT GTC TAC AAG (SEQ ID n°22) 
amorce antisens : ACC AGC TGG TTG ACG GAG (SEQ ID n° 23) 

- couple n° 3 : 

amorce sens : GTC AAC CAG CTG GTG GGC CAG (SEQ ID n° 24) 
amorce antisens : GTG GAT CTC GGC CTC C (SEQ ID n° 25) 

- couple n" 4 : 

amorce sens : AGG CCG GCG TGG GGA AG (SEQ ID n° 26) 
amorce antisens : CTT GGC GAT CTG GCA GTA G (SEQ ID n° 27) 

- couple n° 5 : 

amorce sens : GCG GCC ACG ACC GTG A (SEQ ID n° 28) 
amorce antisens : GGC AGC TTG GGT CTC TGG (SEQ ID n°29) 

- couple n° 6 : 

amorce sens : CTG TAC GTC GGT GAC CCC (SEQ ID n°30) 
amorce antisens : TCA GTG GAT CTC GGC CTC (SEQ ID n° 31) 

- couple n" 7 : 

amorce sens : AGG GGA CGC AGC GAA ACC (SEQ ID n° 32) 
amorce antisens : GGC AGC TTG GGT CTC TGG (SEQ ID n° 29) 

- couple n" 8 : 

amorce sens : CCCCCCCCCCCCCCN (oil N est egal a G, A ou T) 
amorce antisens : CCA TCA GCT CCA GGC TCT C (SEQ ID n° 33) 

- couple n° 9 : 

amorce s ns : CCCCCCCCCCCCCCN (ou N est egal a G, A ou T) 
amorce antisens : CCA GGA CAG GCG CAG ATG (SEQ ID n° 34) 
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amorce sens : CCCCCCCCCCCCCCCN (ou N est egal a G A ou T) 
amorce antisens : CTT GGC GAT CTG GCA GTA G (SEQ ID n« 27) 

- couple n° 11 : 

amorce sens : C AC CTA CTC CAG GGA TGC (SEQ ID „• 37) 
amorce antisens : AGG AAA ATA GAA GCG TCA GTC (SEQ ID n° 38) 



- couple n° 19 : 



amorce sens : CAG GCC CAC TTG CCT GCC (SEQ ID „• 39, 
amorce antisens : CTG TCC CCA AGC TGA TGA G (SEQ ID „• 40) 

Ces amorces correspondent aux sequences al lant respectivement 

- du nuclide n° 124 au nucleotide n- 140 sur SEQ ID „• 1 e, du nucleotide n- 
1 au nucleotide n- 17 sur SEQ ID n'S pour SEQ ID N» 20 

" ™*° Ude "° 2280 3U nud * c "* 2262 « SEQ ID n- 1 e, du nucleotide 
n 2156 au nucleotide 2138 sur SEQ ID nS pour SEQ ID N° 21 

- du nucleotide n- 684 au nucleotide n- 701 sur SEQ ID n- 1 pour SEQ ID N° 22 

■ u nudeoMe n- 1447 au nucleotide n- ,430 sur SEQ ID n- 1 e! du u UL 
1324 au nucleotide 1307 sur SEQ ID n-5 pour SEQ ID N> 23 

- du nucleotide 1434 au nucleotide . 1454 sur SEQ iD n"1 et du nucleotide 1311 
au nucleotides sur SEQ ID n'S pour SEQ ID „■ 24 

• du nucleotide 2066 au nucleotide 205, sur SEQ ID n-1 e. du nucleotide 1940 
2s ^"^da 1925 sur SEQ iDn'5 pour SEQ ,On-25 

• du nucleotide 16 au nucleotide 32 sur SEQ ,D „• 5 pour SEQ ID n- 26 

- du nuclide 503 au nudeotide 485 sur SEQ ID n- 5 pour SEQ ID n- 27 

- du nucleotide ,60 au nucleotide 176 sur SEQ ID n* 11 pour SEQ ,D n- 28 

- du nucleotide 1993 au nudeo.de 1976 sur SEQ ,D n« 5 pour SEQ 

■ du nudeoMe 263 au nudeotide 280 sur SEQ ,D n- , 1 pour SEQ ,D n- 30 

• du nuc eot.de 1943 au nudeoflde ,926 sur SEQ ,D „• 5 pour SEQ ID n 31 

'T::r::z a :^ ussu 

- du nudeotide 1 167 au nudeotide 1 149 sur SEQ ,D „• 5 pour SEQ ID n- 33 
-dunudeo«de928aunudeo«,d.91, sur SEQ ID n° 5 pour SEQ ID n° 34 

- du nucleotide 677 au nudeotide 659 sur SEQ ID n° 5 pour SEQ ID n- 3^ 

- du nucleotide ,605 au nudeo.de ,587 sur SEQ ID n° 5 pour SEQ ID n 36 
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- du nucleotide 1 au nucleotide 18 sur la sequence nucleotidique representee a la 
figure 13 pour SEQ ID n° 37 

- du nucleotide 833 au nucleotide 813 sur la sequence nucleotidique representee 
a la figure 13 pour SEQ ID n° 38 

- du nucleotide 25 au nucleotide 42 sur la sequence nucleotidique representee a 
la figure 13 pour SEQ ID n° 39 

- du nucleotide 506 au nucleotide 488 sur la sequence nucleotidique representee 
a la figure 13 pour SEQ ID n° 40 



Les sequences nucleotidiques selon I'invention peuvent avoir par aiileurs des 
utilisations en therapie genique, notamment pour le controle des phenomenes d'apop- 
tose et de reversion de la transformation. 

Les sequences nucleotidiques selon I'invention peuvent par aiileurs etre utiiisees pour 
la production de proteines recombinantes SR-p70, selon la definition qui a ete donnee 
a ce terme. 

Ces proteines peuvent etre produites a partir des sequences nucleotidiques definies 
ci-dessus, selon des techniques de production de produits recombinants connues de 
I'homme du metier. Dans ce cas, la sequence nucleotidique utilisee est placee sous le 
controle de signaux permettant son expression dans un note cellulaire. 
Un systeme efficace de production d'une proteine recombinante necessite de 
disposer d'un vecteur, par exemple d'origine plasmidique ou virale, et d'une cellule 
note compatible. 

L'hdte cellulaire peut etre choisi parmi des systemes procaryotes. comme les bacte- 
ries, ou eucaryotes, comme par exemple les levures, cellules d'insectes, CHO 
(cellules d'ovaires de hamster chinois) ou tout autre systeme avantageusement 
disponible. Un hdte cellulaire prefere pour I'expression des proteines de I'invention est 
constitue par la bacterie E. coli, notamment la souche MC 1061 (Clontec). 
Le vecteur doit comporter un promoteur, des signaux d'initiation et de terminaison de 
la traduction, ainsi que les regions appropriees de regulation de la transcription. II doit 
pouvoir etre maintenu de facon stable dans la cellule et peut eventuellement 
posseder des signaux particuliers specifiant la secretion de la proteine traduite. 
Ces differents signaux de contrdle sont choisis en fonction de l'hdte cellulaire utilise. A 
cet effet, les sequences nucleotidiques selon I'invention peuvent etre inserees dans 
des vecteurs a replication autonome au sein de l'hdte choisi, ou des vecteurs 
integrals de l'hdte choisi. De tels vecteurs s ront prepares selon les methodes 
couramment utiiisees par I'homme du metier, et les clones en resultant peuvent etr 
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introduits dans un hote approprie par des methodes standard, telles que par exemple 
I'electroporation. 

Les vecteurs de clonage et/ou d'expression contenant au moins I'une des sequences 
nucleotidiques definies ci-dessus font egalement partie de la presente invention. 
Un vecteur de clonage et d'expression prefere est le plasmide pSE1 qui comporte a la 
fois les elements necessaires pour son utilisation comme vecteur de clonage dans 
E.coli (origine de replication dans E. coli et gene de resistance a 1'ampicilline, 
provenant du plasmide pTZ 18R). et comme vecteur d'expression dans les cellules 
animates (promoteur, intron, site de polyadenylation, origine de replication du virus 
SV40), ainsi que les elements permettant sa copie en simple brin dans un but de 
sequencage (origine de replication du phage f1). 

Les caracteristiques de ce plasmide sont decrites dans la demande EP 0 506 574. 
Sa construction, ainsi que Integration des ADNc provenant des sequences d'acides 
nucleiques de invention sont par ailleurs decrites dans les exemples ci-apres. 
Selon un mode de realisation prefere, les proteines de I'invention sont sous forme de 
proteines de fusion, notamment sous forme de proteine fusionnee avec la glutathione 
S-transferase (GST). Un vecteur d'expression designe dans ce cas est represents par 
le vecteur plasmidique pGEX-4T-3 (Pharmacia ref-27.4583). 

L'invention vise en outre les cellules notes transferees par ces vecteurs precedents. 
Ces cellules peuvent etre obtenues par ('introduction dans des cellules hdtes d'une 
sequence nucleotidique inseree dans un vecteur tel que defini ci-dessus, puis la mise 
en culture desdites cellules dans des conditions permettant la replication et/ou 
I'expression de la sequence nucleotidique transferee. 

Ces cellules sont utilisables dans une methods de production d'un polypeptide 
recombinant de sequence SEQ ID n° 2. SEQ ID n° 4, SEQ ID n° 6, SEQ ID n°8. 
SEQ ID n°10. SEQ ID n° 12, SEQ ID n° 14. SEQ ID n° 16 ou SEQ ID n° 18 ou tout 
fragment ou derive biologiquement actif de celui-ci. 

La methods de production d'un polypeptide de I'invention sous forme recombinante 
est elle-meme comprise dans la presente invention, et se caracterise en ce que I'on 
cultive les cellules transferees dans des conditions permettant I'expression d'un 
polypeptide recombinant de sequence SEQ ID n° 2. SEQ ID n° 4, SEQ ID n° 6, SEQ 
ID n°8. SEQ ID n°10. SEQ ID n° 12, SEQ ID n° 14. SEQ ID n" 16 ou SEQ ID n° 18 ou 
de tout fragment ou derive biologiquement actif de celui-ci. et que I'on recupere ledit 
polyp ptide recombinant. 

Les precedes de purification utilises sont connus de I'homme du metier. Le 
polypeptide r combinant peut etre purifie a partir de lysats et extraits cellulaires, du 
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surnageant du milieu de culture, par des methodes utilisees individuellement ou en 
combinaison, telles que le fractionnement, les methodes de chromatographic, les 
techniques d'immunoaffinite a I'aide d'anticorps mono ou polyclonaux specifiques, etc. 
Une variante preferee consiste a produire un polypeptide recombinant fusionne a une 
proteine "porteuse" (proteine chimere). L'avantage de ce systeme est qu'il permet une 
stabilisation et une diminution de la proteoiyse du produit recombinant, une 
augmentation de la solubilite au cours de la renaturation in vitro et/ou une simplifi- 
cation de la purification lorsque le partenaire de fusion possede une affinite pour un 
ligand specifique. 

Avantageusement, les polypeptides de i'invention sont fusionnes avec la glutathion 
S-transferase en position N-terminale (systeme "GST' Pharmacia). Le produit de 
fusion est dans ce cas detecte et quantifie grace a I'activite enzymatique de la GST. 
Le reactif colorimetrique utilise est un accepteur de gluthation, substrat de la GST. Le 
produit recombinant est purifie sur un support de chromatographie auquel ont ete 
prealablement couplees des molecules de glutathion. 

Les anticorps mono ou polyclonaux capables de reconnaitre specifiquement un 
proteine SR-p70 seion la definition donnee precedemment font egalement partie de 
I'invention. Des anticorps polyclonaux peuvent etre obtenus a partir du serum d'un 
animal immunise contre la proteine, produite par exemple par recombinaison 
genetique suivant la methode decrite ci-dessus, selon les modes operatoires usuels. 
Les anticorps monodonaux peuvent etre obtenus selon la methode classique de 
culture d'hybridomes decrite par Kdhler et Milstein, Nature, 1975, 256, 495-497. 
Des anticorps avantageux sont des anticorps diriges contre la region centrale 
comprise entre le residu 1 10 et le residu 310 pour les sequences SEQ ID n° 2 ou 6 ou 
entre le residu 60 et le residu 260 pour la sequence SEQ ID n° 8. 



Les anticorps selon I'invention sont par exemple des anticorps chimeriques, des 

anticorps humanises, des fragments Fab et F(ab')2. lis peuvent egalement se 

presenter sous forme d'immunoconjugues ou d'anticorps marques. 

Par ailleurs, outre leur utilisation pour la purification des polypeptides recombinants, 

les anticorps de I'invention, en particulier les anticorps monodonaux, peuvent 

egalement etre utilises pour la detection de ces polypeptides dans un echantillon 

biologique. 

lis constituent ainsi un moyen d'analys immunocytochimique ou 
immunohistochimique de I'expression de proteines SR-p70 sur des coupes de tissus 
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specifiques, par exemple par immunofluorescence, marquage a Tor, 
immunoconjugues enzymatiques. 

lis permettent notamment de mettre en evidence une accumulation anormale de 
proteines SR-p70 dans certains tissus ou prelevements biologiques, ce qui les rend 
utiles pour la detection des cancers ou le suivi de revolution ou de la remission de 
cancers preexistants. 

Plus generalement, les anticorps de invention peuvent etre avantageusement mis en 
oeuvre dans toute situation ou I'expression d'une proteine SR-p70 doit etre observee. 
L'invention conceme done egalement un procede de diagnostic in vitro de pathologies 
correlees a une expression ou une accumulation anormale de proteines SR-p70, 
notamment les phenomenes de cancerisation, a partir d'un prelevement biologique, 
caracterise en ce que Ton met en contact au moins un anticorps de l'invention avec 
ledit prelevement biologique, dans des conditions permettant la formation eventueile 
de complexes immunologiques specifiques entre une proteine SR-p70 et le ou lesdits 
anticorps et en ce que Ton detecte les complexes immunologiques specifiques even- 
tuellement formes. 

L'invention conceme egalement un kit pour le diagnostic in vitro d'une expression ou 
une accumulation anormale de proteines SR-p70 dans un prelevement biologique 
et/ou pour la mesure du taux d'expression de celle-ci dans ledit prelevement compre- 
nant : 

- au moins un anticorps specifique d'une proteine SR-p70, eventueliement fixe 
sur un support, 

- des moyens de revelation de la formation de complexes antigenes/anticorps 
specifiques entre une proteine SR-p70 et ledit anticorps et/ou des moyens de 
quantification de ces complexes. 

L'invention vise egalement une methode de diagnostic precoce de la formation des 
tumeurs. par la mise en evidence dans le serum d'un individu, d'auto-anticorps diriges 
centre une proteine SR-p70. 

Une telle methode de diagnostic precoce est caracterisee en ce que Ton met en 
contact un echantillon de serum preleve chez un individu avec un polypeptide de 
l'invention, eventueliement fixe sur un support, dans des conditions permettant la 
formation de complexes immunologiques specifiques entre ledit polypeptide et les 
auto-anticorps eventueliement presents dans I'echantillon de serum, et en ce que Ton 
detecte les complexes immunologiques specifiques eventueliement form s. 
L'invention a egalement pour objet une methode de determination d'une variabilite 
allelique, d'une mutation, d'une deletion, d'une insertion, d'une perte d'heterozygotie 
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ou d'une anomalie genetique du gene SR-p70, pouvant etre impliquees dans des 
pathologies caracterisee en ce qu'elle utilise au moins une sequence nucleotidique 
decrite ci-dessus. Parmi ies methodes de determination d'une variability allelique, 
d'une mutation, d'une deletion, d'une insertion, d'une perte d'heterozygotie ou d'une 
anomalie genetique du gene SR-p70 f on prefere la methode caracterisee en ce 
qu'elle comprend au moins une etape d'amplification par PCR de la sequence 
nucleique cible du SR-p70 susceptible de presenter un polymorphisme, une mutation, 
une deletion ou une insertion a l'aide de couple d'amorces de sequences 
nucleotidiques definies ci-dessus, une etape au cours de laquelle on procede au 
traitement des produits amplifies a I'aide d'enzyme de restriction approprie et une 
etape au cours de laquelle on procede a la detection ou au dosage d'au moins I'un 
des produits de la reaction enzymatique. 

L'invention comprend egalement des compositions pharmaceutiques comprenant 
comme principe actif un polypeptide repondant aux definitions precedentes, prefe- 
rentiellement sous forme soluble, associe a un vehicule pharmaceutiquement 
acceptable. 

De telles compositions offrent une nouvelle approche pour traiter Ies phenomenes de 
cancerisation au niveau du controle de la multiplication et la differenciation cellulaire. 
Preferentiellement, ces compositions peuvent etre administrees par voie systemique, 
de preference par voie intraveineuse, par voie intramusculaire, intradermique ou par 
voie orale. 

Leurs modes d'administration, posologies et formes galeniques optimaux peuvent etre 
determines selon Ies criteres generalement pris en compte dans Tetablissement d'un 
traitement therapeutique adapte a un patient comme par exemple rage ou le poids 
corporel du patient, ia gravity de son etat general, la tolerance au traitement et Ies 
effets secondaires constates, etc. 

L'invention comprend enfin une methode de therapie genique dans laquelle des 
sequences nucleotidiques codant pour une proteine SR-p70 sont transferees a des 
cellules cibles par le biais de vecteurs viraux inactives. 

D'autres caracteristiques et avantages de l'invention apparaissent dans la suite de la 
description avec Ies exemples et Ies figures dont Ies legendes sont representees ci- 
apres. 
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Comparaison nucieique de I'ADNc du SR-p70a de .... 
a SEQ ID n°l) avec la sequence nucieique de I'ADNc 
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Figure 9 : 

Figure 10a 
Figure 10b : 



Comparaison proteique de SR-p70a de 
singe (sw : p53-cerae). 



singe (correspondant 
de p53 de singe. 

singe avec la proteine p53 de 



Comparaison de la sequence nucieique de TADNc de SR-p70a et b de 
singe (correspondant respectivement a SEQ ID n° 1 et SEQ ID n° 3). 



Sequence nucieique et sequence proteique deduite 
singe. 



de SR-p70a de 



Sequence nudeique parte,,, e, sequence proteique aeduite 

SR-p70b de singe. 

Sequence nucieique partiel.e et sequence proteique comp.ete deduite 
SR-p70a humain (correspondant a SEQ ID n° 5). 
Sequence nucieique partiel.e et sequence proteique deduite comp.ete 
SR-p70c de souris (correspondant a SEQ ID n° 7). 

iTrtoTJl^ Partie " e 6t S6qU6nCe Pr ° teiqUe ^ ~ * 
&R-p70a de souns (correspondant a SEQ ID n° 9). 

Mul^lgnement des proteines deduites des ADNc SR-p70 de singe 
(a et b), humain (a) et de souris (a et c). 

Immunoempreinte de la proteine SR-p70. 
Detection de la proteine endogene SR-p70. 
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Localisation chromosomique du gene SR-p70 humain. Le signal apparait 
sur le chromosome 1, dans la region p36. 

Structure genomique du gene SR-p70 et comparaison avec celle du 
gene p53. Les sequences proteiques humaines du SR-p70a (ligne du 
haut de I'alignement) et de la p53 (ligne du bas) sont morcelees en 
peptides en fonction des exons respectifs a partir desquels tls sont 
codes. Les chiffres au niveau des fleches correspondent a la 
numerotation des exons correspondants. 

Sequence genomique humaine du SR-p70 depuis le 3' de I'intron 1 
jusqu'au 5* de i'exon 3. Les introns sont encadres. Aux positions 123 et 
133, sont localisees deux positions nucleiques variables (G — > A en 123 
e t C -» T en 133). Les sites de restriction de I'enzyme Sty I - sont 
soulignes (position 130 dans le cas ou il y a presence d'un T au lieu d'un 
C a la position 133, position 542 et position 610). Les fleches 
positionnent les amorces nucleiques utiiisees dans I'exemple XI. 

Comparaison nucleique du 5* des ADNc humains du SR-p70d et du 
SR-p70a. 



Multialignement des sequences nucleiques correspondant au SR-p70 
humain a, b, d, e t et f. 



Multi-alignement des proteines deduites des ADNc SR-p70 humains (a ( 
b ( d f e et f). 

Sequence nucleique partieile et sequence proteique deduite partielle du 
SR-p70a humain. Les deux bases en caracteres gras correspondent a 
deux positions variables (voir figure 6). Cette sequence presente une 
region 5 1 non codante plus complete que celle presentee dans la figur 

6. 

Analyse des transcrits SR-p70a apres amplification par PCR. 

piste M : marqueurs de poids moleculaires "1 kb ladder (GIBCO-BRL) 
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piste 1 : lignee HT29 
piste 3 : lignee SK-N-AS 
piste 5 : lignee UMR-32 
piste 7 : lignee U-373 MG 
5 piste 9 : lignee SW 480 

piste 11 : lignee CHP 212 
piste 13 : lignee SK-N-MC 

pistes 2, 4, 6, 8, 10, 12, 14 : temoins negatifs correspondent aux pistes 

10 

1, 3, 5, 7, 9, 11 et 13 respectivement (absence de transcriptase inverse 
dans la reaction RT-PCR). 

Figure 19: A ; Analyse par electrophorese sur gel d'agarose des fragments 
genomiques amplifies par PCR (depuis le 3 1 de I'intron 1 jusqu'au 
5* de I'exon 3). La numerotation des pistes correspond a la 
numerotation de I'echantillonnage temoin. Piste M : marqueurs de 
poids moleculaires ("1 kb ladder"). 
B : Analyse identique a cede de la partie A apres une digestion par 
I'enzyme de restriction Styl des memes echantillons 

20 

Figure 20 : Representation schematique avec une carte de restriction partielie du 
plasmide pCDNA3 contenant le SR-p70a humain. 



25 



30 



35 
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EXEMPLE I 

Clonage de I'ADNc du SR-p70 de cellules COS-3. 

1. Culture des cellules COS-3 

Les cellules COS-3 (cellules de rein de singe vert d'Afrique transformees par 
I'antigene T du virus SV 40) sont cultivees dans le milieu DMEM (GIBCO-BRL refe- 
rence 41 965-047) contenant 2 mM de L-glutamine et supplements avec 50 mg/l de 
gentamycine et de 5 % de serum de bovin foetal (GIBCO-BRL reference 10231-074) 
jusqu'a semi-confluence. 

2. Preparation de I'ARN messager 
a) extraction de I'ARN messager 

Les cellules sont recuperees de la facon suivante : 

- les cellules adherentes sont lavees deux fois avec du tampon PBS (phosphate 
buffered saline, reference 04104040-GIBCO-BRL) puis grattees avec un grattoir 
en caoutchouc et centrifugees. 
Le culot cellulaire est mis en suspension dans le tampon de lyse de composition 
suivante : guanidine-thiocyanate 4M ; citrate de sodium 25mM pH 7 ; sarcosyl 0,5 
% ; B-mercaptoethanol 0,1 M. La suspension est soniquee a I'aide d'un sonicateur 
Ultra-Turrax n° 231256(Janke et Kundel) a puissance maximale pendant une 
minute. On ajoute de I'acetate de sodium pH 4 jusqu'a 0,2 M. La solution est 
extraite avec un volume d'un melange phenol/chloroforme (v/v ; 5/1). On precipite 
a -20°C I'ARN contenu dans la phase aqueuse a I'aide d'un volume d'isopropanol. 
Le culot est resuspendu dans le tampon de lyse. La solution est a nouveau extraite 
avec un melange phenol/chloroforme et I'ARN est precipite avec de I'isopropanol. 
Apres lavage du culot avec de I'ethanol 70 % puis 100 %, I'ARN est resuspendu 
dans de I'eau. 
b) Purification de la fraction poly A* de I'ARN 

La purification de la fraction poly A* de I'ARN est realisee a I'aide du kit Dynabeads 
oligo (dT) 2S de DYNAL (reference 610.05) suivant le protocole preconise par le 
fabricant. Le principe est base sur ('utilisation de billes polystyrene super- 
paramagnetique sur lesquelles est attache un oligonucleotide poly(dT) 2S . La frac- 
tion poly A* d I'ARN est hybridee sur l'oligo(dT) 25 couple aux billes que I'on piege 
sur un support magnetique. 



WO 97/28186 



PCT/FR97/00214 



18 

3. Constitution de la banque d'ADN compiementaire 

a) preparation de I'ADN compiementaire 

A partir de 0,5 \xq des ARN-poly A" de cellules COS-3 obtenus a Tissue de I'etape 
2, on prepare I'ADN compiementaire simple-brin marque au 32 P.dCTP (I'ADN 
compiementaire obtenu presente une activite specifique de 3000 dpm/ng) avec 
I'amorce synthetique de sequence suivante (comprenant un site BamHI) : 
5'<GATCCGGGCC C I I I I I I I I I TTT<3 , 

dans un volume de 30 ^l de tampon de composition : Tris HCI 50 mM pH 8,3, 
MgCI 2 6 mM, DTT 10 mM, KCI 40 mM, contenant 0,5 mM de chacun des 
desoxynucieotides triphosphates, 30^iCi de dCTP a 32 P et 30 U de RNasin (prome- 
ga). Apres une heure d'incubation a 37°C, puis 10 minutes a 50°C f puis de 
nouveau 10 minutes a 37°C, avec 200 unites de I'enzyme transcriptase inverse 
RNase H* (GIBCO-BRL reference 8064A), on ajoute 4 d'EDTA. 

b) Hydrolyse alcaline de la matrice ARN 

On ajoute 6 fil d'une solution de NaOH 2N, puis on incube pendant 5 minutes a 
65° C. 

c) Purification sur colonne sephacryl S400 

Afin d'eliminer Tamorce synthetique, on purifie I'ADN compiementaire sur une 
colonne de 1 ml de sephacryl S400 (Pharmacia), equilibree dans du tampon TE. 
Les deux premieres fractions radioactives sont regroupees et precipitees avec 
1/10 de volume d'une solution d'acetate d'ammonium 10 M et 2,5 volumes 
d'ethanol, ceci apres une extraction, avec un volume de chloroforme. 

d) Addition homopolymerique de dG 

On allonge I'ADN compiementaire en 3' avec une "queue" de dG avec 20 unites de 
I'enzyme terminate transferase (Pharmacia 27073001). On incube dans 20 nl de 
tampon de composition : Tris HCI 30 mM pH 7,6 ; chlorure de cobalt 1mM, acide 
cacodylique 140 mM, DTT 0,1 mM, dGTP 1 mM, pendant 15 minutes a 37°C, puis 
on ajoute 2 d'EDTA 0,5 M. 

e) On repete a nouveau les etapes b) et c) 

0 Appariement du vecteur de clonage pSE1 (EP 506 574) et de I'ADN 
compiementaire en presence de I'adaptateur. 

On centrifuge, le culot est dissous dans 33 fil de tampon TE, on ajoute 5 \i\ (125 
ng) de vecteur de clonage pSE1, 1 ^1(120 ng) de I'adaptateur de sequence sui- 
vante (comprenant un site Apal) : 
5*AAAAAAAAAAAAAGGGCCCG3\ 
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10 nl d'une solution de NaCI 200 mM, on incube pendant 5 minutes a 65°C puis 
on iaisse refroidir le melange reactionnel jusqu'a temperature ambiante. 

g) Ligation 

On ligue ie vecteur de clonage et I'ADNc simple brin dans un volume de 100 fil avec 
32,5 unites de I'enzyme ADN ligase du phage T4 (Pharmacia reference 270 87002) 
pendant une nuit a 15°C dans un tampon de composition : Tris HCI 50 mM pH 7,5, 
MgCl2 10 mM, ATP 1 mM. 

h) Synthese du deuxieme brin de I'ADNc 

On elimine les proteines par extraction au phenol suivie d'une extraction au 
chloroforme, puis on ajoute 1/10eme de volume d'une solution d'acetate d'ammo- 
nium 10 mM, puis 2,5 volumes d'ethanol. On centrifuge, le culot est dissous dans le 
tampon de composition Tris acetate 33 mM pH 7.9 acetate de potassium 62,5 mM, 
acetate de magnesium 1 mM et dithiothreitol (DTT) 1 mM, le deuxieme brin d'AON 
complementaire est synthetise dans un volume de 30 nl avec 30 unites de I'erizyme 
ADN polymerase du phage T4 (Pharmacia, reference 270718) et un melange de 1 
mM des quatre desoxynucleotides triphosphates de dATP, dCTP, dGTP et dTTP. 
ainsi que deux unites de la proteine du gene 32 du phage T4 (Pharmacia, referenc 
27-0213)) pendant une heure a 37"C. On extrait au phenol et on retire les traces de 
phenol par une colonne de polyacrylamide P10 (Biogel P 10-200-400 mesh - 
reference 15011050- Biorad). 

i) Transformation par electroporation 

On transforme des cellules E. Co// MC 1061 avec I'ADN recombinant obtenu 
precedemment par electroporation a I'aide de I'appareil Biorad Gene Pulser (Biorad) 
utilise a 2,5 kV dans les conditions prescrites par le fabricant. puis on fait pousser 
les bacteries pendant une heure dans du milieu dit milieu LB (Sambrook op cite) de 
composition : bactotryptone 10 g/l ; extrait de levure 5 g/l ; NaC1 10 g/l. 
On determine le nombre de clones independants en etalant une dilution au 
1/1000eme de la transformation apres la premiere heure d'incubation sur une boite 
de milieu LB additionne de 1,5 % d'agar (p/v) et de 100 >ig/ml d'ampicilline. appele 
par la suite milieu LB gelose. Le nombre de clones independants est de 1 million, 
j) Analyse des ADNc de la banque 
Dans le cadre de I'analyse de clones individualises de la banque par un 
sequencage nucleique du 5' des ADNc. un clone, denomme SR-p70a s'est revele 
presenter une homologie partielle avec I'ADNc de la proteine deja connue. la 
proteine p53 (Genbank X 02469 et X 16384) (Figure 1). Les squences ont ete 
realisees avec le kit United States Biochemical (reference 70770) et/ou I kit Applied 
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Biosystems (references 401434 et/ou 401628) qui utilisent la methode de Sanger et 
al., Proc. Natl. Acad. Sci. USA ; 1977. 14, 5463-5467. L'ADN plasmidique est 
prepare a partir du kit WIZARD mini preparation (Promega reference A7510). Les 
amorces utilisees sont des oligonucleotides de 16 a 22 mer, complementaires soit 
au vecteur pSE1 dans la region immediatement en 5' de I'ADNc, soit a la sequence 
de I'ADNc. 

Un second ADNc a ete isole a partir de la meme banque en criblant de maniere 
similaire a la technique decrite dans I'EXEMPLE III 3) ci-apres avec un fragment de 
I'ADN SR-p70a marque au 32 P avec le kit BRL "Random Primers DNA labelling 
systems" (reference 18187-013). Les tampons d'hybridation et de lavage sont 
additionnes de 50 % de formamide. Le dernier lavage est realise en 0,1 x SSC/SDS 
0.1 % a 60°C. Cette seconde sequence (ADNc SR-p70b) est identique a la premiere 
mais presente un fragment interne delete (Figure 3). 

Les deux ADNc SR-p70, d'une longueur de 2874 nucleotides (SR-p70a) et de 2780 
nucleotides (SR-p70b) correspondent aux produits d'un seui gene, un epissage 
alternatif entrainant une deletion de 94 bases entre les nucleotides 1637 et 1732 et 
une terminaison prematuree de la proteine codee correspondante. Les proteines 
deduites des deux ADNc presentent respectivement 637 acides amines et 499 
acides amines (Figures 4 et 5). 



EXEMPLE II 

Obtention de la sequence et clonage de I'ADNc de la proteine SR-p70a a partir de 
cellules HT-29 (Adenocarcinome de colon humain). 

1) Culture des cellules HT-29 

Les cellules sont cultivees en milieu McCoy 5 (GIBCO 26600-023) additionne de 10 % 
de serum foetal de veau (GIBCO 10081-23) et 50 mg/l de gentamycine jusqu'a semi- 
confluence. 

2) Preparation de I'ADN comptementaire 

L'ARN messager est prepare comme decrit dans I'EXEMPLE I.2. L'ADNc est prepare 
de maniere similaire a celle decrite dans I'EXEMPLE 1. 3 avec 5 »g d'ARN messager 
total en utilisant une amorce poly(T) 12 . La reaction n'est pas interrompue avec de 
I'EDTA. 
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3) Amplification specifique de I'ADNc humain par la technique dite de PCR 

La polymerisation est reaiisee avec 4 nl d'ADNc dans 50 final avec le tampon de 
composition suivante : Tris HCI 10 mM pH 8,3, MgCI 2 2,5 mM, KCI 50 mM en 
presence de 10 % DMSO, dNTP 0,5 mM, 4 ng/ml de chacune des deux amorces 
nucleiques et de 2,5 unites de Taq A.DN polymerase (Boehringer). Les couples 
d'amorces ont ete choisis sur la sequence nucleique du clone SR-p70 de COS-3, 
notamment en amont de I'ATG d'initiation et en aval du TGA d'arret de traduction et 
sont de compositions suivantes : 

amorce sens : ACT GGT ACC GCG AGC TGC CCT CGG AG 
site de restriction Kpn I 

amorce antisens : GAC TCT AGA GGT TCT GCA GGT GAC TCA G. 

site de restriction Xba I 

La reaction est reaiisee durant 30 cycles 94°C/1 minute, 54-60°C/1 minute 30 
secondes et 72°C/1 minute 30 secondes, suivi d'un dernier cycle de 72°C/6 minutes. 

4) Obtention de la sequence de I'ADNc humain 

Dans un premier temps, le produit de PCR est elimine des oligonucleotides sur une 
colonne de sephacryl S400 puis dessale par chromatographie d'exclusion sur une co- 
lonne de polyacrylamide P10 (Biorad reference 1504144). Les reactions de 
sequencage sont realisees a I'aide du kit Applied Biosystems (reference 401628) 
avec des oligonucleotides specifiques de I'ADNc. La sequence obtenue est tres 
similaire a cede du SR-p70a de singe et la proteine deduite contient 636 acides 
amines (Figure 6). 

De maniere similaire, d'autres sequences issues de lignees ou de tissus humains ont 
ete obtenues pour la partie codante du SR-p70 humain, notamment a partir du 
poumon ou du pancreas. Les proteines deduites de ces sequences sont identiques a 
celles obtenues pour la lignee HT-29. 

5) Clonage de I'ADNc humain dans le plasmide pCDNA3 (Invitrogen V 790-20) 

Le produit PCR obt nu en 3) ainsi que le plasmide sont digeres par les deux enzymes 
de.r striction Kpn I et Xba I puis purifies apres migration sur un gel d'agarose 1 % a 
I'aide du kit Geneclean (Bio 101 reference 3105). Apres ligation avec 100 ng d'insert 
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et 10 ng de vecteur et transformation (technique decrite dans I'EXEMPLE I 3 q et i les 

r ™ inants sont v " f " par "™ 4 ,,aide du kit App - *~ 



EXEMPLE III 



:x:r du sr - p7 ° de souns 4 -* ae ~- *«■■*> — 

t; Culture cellulate de la lignee AtT-20 

isTt'!""'^''!:* es dans au m " ieu Ham F1 ° (G,BC0 31550 -° 23 > «*"■«"* * 

IcoZI <GIBC0 2605 °- 047) " * " % —» **- * v«u 

(GIBCO 10081-073, e, de 50 mg/l de gemamycine jusqu'a semi-confluence. 

2; Preparation da la banque d'ADN compramantaim 

^ZIZIT """" dans , ' 6XEMPLE 2) et 3 > 4 -* - «— 

3; Criblage de la banque 

a) Preparation des membranes 

tm-m son, trails en les deposan, sur du papier Whatman 3 mm imbibe des 
solutions suivantes : NaOH 0.5 N NaC1 1 s M n»„H„.,. « ■ . 
dHS m^. I*.. .. n, Naci 1.5 M pendant 5 mmutes puis Tris HCI 0.5 M 

PH 8 . NaCI 1.5 M pendan, 5 minutes. Apres un traitement a la proteinase K dans le 
•ampon su*an, : Trfs HC, 10 mM pH 8 . EDTA ,0 m M . Nad 50 I sos 0 = 

son, lavees abondammen, dans du 2 x SSC (sodium citrate NaCI) sechees puis 
■ncubees au four sous »ide a 80'C pendan, 20 minutes. ' 
b) Preparation de la sonde 

stuence^etlrealr 8 **, ^ SR -" 7 ° * *- « ™ — 

2o q coie ; =r r? 4 r de rARNm de ,a a,t - 

suivantes : EXEMPLE II.3 e, 4 avec les oligomeres de compositions 
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amorce sens : GCC ATG CCT GTC TAC AAG 
amorce antisens : ACC AGC TGG TTG ACG GAG. 

Sur la base de cette sequence, une sonde oligomerique specifique de souris a ete 
choisie et presente la composition suivante : 
GAG CAT GTG ACC GAC ATT G. 

100 ng de la sonde sont marques en 3' avec 10 unites de Terminal Transferase 
(Pharmacia) et 100 uCi de dCTP a 3 2p 3000 Ci/mmole (Amersham reference PB 
10205) dans 10 ul du tampon suivant : Tris HCI 30 mM pH 7.6 , acide cacodylique 
140 mM, CoCI 2 1 mM, DTT 0.1 mM pendant 15 minutes a 37°C. Les nucleotid s 
radiomarques non incorpores sont elimines sur une colonne de polyacrylamide P10 
(Biorad, reference 1504144). La sonde obtenue a une activite specifique environ de 
5.10 8 dpm/Mg. 

c) Prehybridation et hybridation 

Les membranes preparees en a) sont prehybridees 30 minutes a 42"C dans 6 x SSC, 
5 x Denhart's, 0.1 % SDS puis hybridees quelques heures dans le meme tampon 
additionne de la sonde preparee en b) a raison de 10 6 dpm/ml. 

d) Lavage et exposition des membranes 

Les membranes sont lavees deux fois a temperature ambiante dans le tampon 2 x 
SSC/SDS 0.1 % puis une heure a 56°C en 6 x SSC/SDS 0.1 %. Les clones hybrid s 
sont reveles avec des films KODAK XOMAT. Un clone positif contenant le SR-p70 d 
souris est selectionne et denomme ci-apres SR-p70c. 

4) SGquengage du SR-p70 de souris et analyse de la sequence 
La sequence est obtenue a I'aide du kit Applied Biosystem (reference 401628). La 
sequence proteique deduite de I'ADNc SR-p70c de souris (Figure 7) presente une 
tres forte homologie avec cedes de I'humain et de singe excepte dans la partie N- 
terminale qui diverge fortement (voir Figure 9). A I'aide de la technique dite de PCR, 
de maniere similaire a celle decrite dans I'EXEMPLE II.3 et 4, une seconde sequence 
5' (issue de la meme banque AtT-20) a ete obtenue (Figure 8). La sequence 
proteique N-terminale deduite (sequence denomme SR-p70a) est tres similaire a celle 
deduite des ADNc SR-p70 humain et de singe (SR-p70a) (Figure 9). La lignee AtT-20 
presente done au moins deux transcripts SR-p70. Ces 2 derniers divergent dans la 
partie N-terminale par des epissages differents. 
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EXEMPLE IV 

1) Production de proteine recombinants SR-p70 dans E. coli 
a) Construction du piasmide depression 

EHe consiste a mettre .a partie -COOH terminate de .a proteine SR-p70a de singe 
depu.s ,a val.ne en position 427 a I'nistidine -COOH termina.e en position 637 en 
us.on avec ,a glutathione S-transferase (GST) du vecteur p.asmid que pGE X-4T 3 
Pharmaca reference 27-4583). Pour cela, ,'insert correspondant de ,a SR P 7 0 a 

^z:^ a r amp,i " par pcr avec 10 ng - ~ ~ 

SR - P?0a dS S,nge - Les amorce * nucleiques sont de composition suivante : 

amorce sens : TTT GGATCC GTC AAC CAG CTG GTG GGC CAG 
site de restriction BamHI 

amorce antisens : AAA GTC GAC GTG GAT CTC GGC CTC C. 
site Sal I 

BamHI et Sal I et le clonage est realise comme decrit dans I'EXEMPLE II 5 Le done 
selectionne est appeie pG SR-p70. 

b) Expression et purification de la proteine fusion GST-pSR-p70 

O. maniere schema*,™. le done recombinant a et. mis en cuiu,re a 37'C dans un 

tl: '^ ™ * an,P,C "" ne 100 «** A °° °' 8 - es, ^izz 

u.o mM dIPTG pendant 2 heure<8 a i7°n a«»a- . ., 

• , neures a 37 c - A Pres centnfugation, le culot cellulaire est 

1m. , n * M " ^ a9i,a,l0n * * m <*'*>™ ambiante Ap^s 

Z eTe " r ^ °°° * 10 minU ' eS 3 4 ° C ' °" * «~ 

eph^e lB tT^ " U ™ C0 '° nne * tfamn** gin" 

nlEl e ' ' e ' aVa " S ° n ' rta " S " S e " «■"»» PB * « reLon e* 

* 300 / r mPe, * 0n 8VeC dU 9lua,fti0 " *«■ " «W* M. e* amen/e 
a 300 ng/ml de proteine fusion. amenee 
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2) Production de proteine SR-p70a dans les cellules COS-3. 

Les cellules COS-3 sont transferees avec de I'ADN plasmidique pSE1 dans lequel a 
ete clone I'ADNc de SR-p70a de singe (EXEMPLE 1.1) ou avec de I'ADN plasmidique 
du vecteur pSE1 en tant que temoin par la technique du DEAE Dextran : les cellules 
COS-3 sont ensemencees a 5 x 10 5 cellules par boite de 6 cm en milieu de culture 
contenant 5 % de serum de bovin foetal (EXEMPLE 1.1). Apres culture, les cellules 
sont rincees avec du PBS. On ajoute 1 ml du melange suivant : milieu contenant 6,5 
ug d'ADN, 250 ug/ml de DEAE Dextran et 100 uM de chloroquine. Les cellules sont 
incubees a 37°C en 5 % CO2 durant 4 a 5 heures. Le milieu est aspire, on ajoute 2 ml 
de PBS additionne de 10 % DMSO et les cellules sont incubees pendant une minute 
en remuant legerement les boites. Le milieu est a nouveau aspire et les cellules sont 
rincees deux fois avec du PBS. Les cellules sont alors incubees a 37°C avec du 
milieu contenant 2 % de serum de bovin foetal pendant la duree de I'expression qui 
est generalement de 3 jours. 

La proteine SR-p70a est alors analysee comme decrit dans I'EXEMPLE VI par 
immunoempreinte. 



EXEMPLE V 

Preparation d'anticorps specifiques 

150 jig de proteines de I'echantillon prepare selon I'EXEMPLE IV ont ete utilises pour 
immuniser un lapin (male de 1,5 a 2 kg environ, New-Zealand). Les immunisations ont 
ete effectuees tous les 15 jours selon le protocole decrit par Vaitukaitis, Methods in 
Enzymology, 1981, 73, 46. Pour la premiere injection, un volume de solution antige- 
nique est emulsifie par un volume d'adjuvant complet de Freund (Sigma reference 
4258). Cinq rappels ont ete administres en adjuvant incomplet de Freund (Sigma 
reference 5506). 

EXEMPLE VI 

Detection de la proteine SR-p70 "Western immunoblotting" (immunoempreinte) 

1) Materials utilise" <s pour /'immunoempreinte 

a) Lignees cellulaires utilisees pour I'immunoempr int . 

Les lignees cellulair s suivantes ont ete cultivees. comm decrit dans le catalogue 
«catalogu of cell lines and hybridomas, 7*" edition, 1992» de I'ATCC (American Type 



WO 97/28186 



26 



PCT/FR97/00214 



CuKure cordon, : COS-3. OV-1 (lignee de ce.lules de rein de singe, HT 29 „ 
73MG glioma humain, MCF7 (adenocarcinoma mammaire um L, Js 
neuroblast humain ea*. dans |6S m4mes conaitjons ™ ^KNAS 

(neuroUaaome humain). IMR-32 <neurob la s,ome humain) CHP21, rneL! , 

OV-3 adanocaranome d'ovaire, e. SW 480 (adenocarcinoma de colon humain) 
b) Cellules COS-3 transfeclees par I'ADNc SR.p70a 

tes ceilules COS-3 on t M transfectees comma dech, dans reXEMPie IV 2 En tan. 
que ,emo.n, ,es ce»u,es on, M ,rans f ,=,ees av.c de I'ADN plasmid^ue pS E1 ne 
contenant pas I'ADNc recombinant SR.p70a. 

^ ~;zr n * ra ~ * * — ~ ~ - 

Apres culture, les cellules sont lavees avec d.. prq «... 

*PA ( PSS avec 1 % NW0 . O.S % sod^ec^ ' T"" 
10 r , RNAse A. 20^m, DNAse , 2 Jm, ^l^^SST 
a7 ^m, pepstatlne ., 170 ^ PMS F. Les ce„u,es son, soniquees P ar utZti 
C e, laissees 30 minutes a 4-C. Apres microcen«fuga,ion a 12 000 rom o„X 
* sumageant La concent d, proline es, mesl, par , ZZZ ^ 

3) 'Western blotting" 

5 ou 50 M g de proteines (50 pg pour .es iignees cellulalres et 5 ug pour des cellule, 
4; Relation par lanticorps 

u uu idcdi, puis incubee une heur» a 070/^ _ 
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Parallelement, les memes echantillons ont ete reveies par un anticorps anti-p53 (a 
p53) (sigma BP5312) suivi d'un second anticorps anti-immunoglobine de souris. 

5) Figures et resultats. 

Figure 10 : tmmunoempreinte de la proteine SR-p70 

Figure 10a : Detection de la proteine recombinante SR-p70 

- colonnes 1 et 3 : COS-3 transferee par ie vecteur pSE1. 

- colonnes 2 et 4 : COS-3 transferee par le plasmide pSE1 contenant I'ADNc du 
SR-p70a. 

- colonnes 1 et 2 : Revelation par I'anticorps anti-SR-p70 (aSR-p70). 

- colonnes 3 et 4 : Revelation par I'anticorps anti-P53 (ap53). 
Figure 10b : Detection de la proteine endogene SR-p70 

- colonnes 1 : COS-3 ; 2 : CV-1 ; 3 : HT-29 ; 4 : U-373 MG ; 5 : MCF7 ; 6 : SKNAS ; 7 
: SK-N-MC ; 8 ; IMR-32 ; 9 : CHP212 ; 10 : Saos-2 ; 11 : SK-OV-3 et 12 : SW480. 

A : Revelation par I'anticorps aSR-p70. 
B : Revelation par Tanticorps ap53. 

L'anticorps aSR-p70 reconnait specifiquement les proteines recombinantes (Figur 
10a) et endogenes (Figure 10b) et ne croise pas avec la p53. Uanalyse de lignees 
cellulaires humaines ou de singe montre que la proteine SR-p70 comme la p53 est 
generaiement faiblement detectable. Par centre, lorsqu'une accumulation de p53 
existe, la SR-p70 devient elle aussi plus facilement detectable (Figure 10b). Une 
etude par RT-PCR de la distribution des transcrits SR-p70 montre que le gene est 
exprime dans tous les types cellulaires testes. 



EXEMPLE VII 

Clonage du gene du SR-p70 et localisation chromosomique. 
1) Clonage du g&ne SR-p70 

La banque utilisee est une banque de cosmides, preparee avec de I'ADN genomique 
humain purifi ' de placenta, et commercialisee par Stratagene (reference 95 1202). 
Le criblage du gene est realise comme decrit dans I'exempl III. 3 avec un fragment 
d'ADN SR-p70 marque au 32 p avec je kjt BRL » Random pri me rs DNA Labelling 
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Systems" (reference 18187-013). Les tampons d'hybridation et de lavage sont 
additionnes de 50 % formamide. Le dernier lavage est realise en 0,1 x SSC/SDS 
0.1 % a 60°C. De maniere similaire, le gene SR-p70 a ete isole a partir d'une banque 
preparee avec de I'ADN genomique de la souris black C57. 

Une analyse et un sequencage partiei des clones mettent en evidence la presence de 
14 exons avec une structure proche de celle du gene p53, notamment dans la partie 
centrale ou la taille et le positionnement des exons sont tres conserves (Figure 12). 
Cette structure a ete definie partiellement chez la souris et chez I'homme. 
A titre d'exemple, les sequences genomiques humaines du 3' de I'intron 1 , de l exon 
2, de I'intron 2, et du 5" de lexon 3 sont presentees dans la figure 13. 

2) Localisation chromosomique du gene SR-p70 chez I'homme 
Elle a ete realisee avec de I'ADN du gene SR-70 humain en utilisant la technique 
decrite par R. Slim et al., Hum. Genet.. 1991, 88, 21-26. Cinquante mitoses ont ete 
analysees dont plus de 80% avaient des doubles spots localises en 1p36 sur les deux 
chromosomes et plus particulierement en 1p36.2 -1p36.3 (Figure 11). (.'identification 
du chromosome 1 et son orientation sont basees sur I'heterochromatine de la 
constriction secondaire. Les images ont ete faites sur un microscope Zeiss Axiophot, 
saisies par une camera CCD refroidie LHESA et traitees par Optilab. 



EXEMPLE VIII 

A) Mise en evidence d'un ARNm codant pour une proteine SR-p70 humaine deduite 
presentant a la fois une extremite N-terminale plus courte et une divergence. 

1) Cultures des cellules IMR-32 (neuroblastoma humain) 

Les cellules ont ete cultivees comme decrit dans le catalogue "catalogue of cell lines 
and hybridomas, 7th edition, 1992" de I'ATCC (American Type Culture Collection). 

2) Preparation de I'ADNc 

L'ARN est prepare comme decrit dans I'exemple l.2.a. L'ADNc est prepare de maniere 
similair a celle decrite dans I'exemple I.3 avec 5 ug d'ARN total dans un volume final 
de 20 ul en utilisant une amorce poly (T) 12 et avec des nucleotides froids. La reaction 
n'est pas interrompue avec de I'EDTA. 



WO 97/28186 PCT/FR97/00214 

29 



3) Amplification speciftque de I'ADNc SR-P70 par fa technique dite de PCR 

La polymerisation est realisee avec 2 ul d'ADNc dans 50 ul final avec le tampon de 

composition suivant : Tris HCI 50 mM pH 9,2, 16 mM (NH 4 ) 2 S0 4 , 1.75 mM MgCI 2 , 

en presence de DMSO 10%, de NTP 0.4 mM, de 100 ng de chacune des deux 

amorces nucleiques et de 3,5 unites du melange des Taq et PWO polymerases 

(Boehringer Mannheim, ref. 1681 842). 

Le couple d'amorce est de composition suivante : 

amorce sens : AGGCCGGCGTGGGGAAG (position 16 a 32, Figure 6) 
amorce antisens : CTTGGCGATCTGGCAGTAG (position 503 a 485, Figure 6). 

La reaction est realisee durant 30 cycles a 95°C/30 secondes. 58°C/1 minute et 
68°C/2 minutes 30 secondes suivi d'un dernier cycle de 68°C/10 minutes. 

Le produit PCR est soumis a une electrophorese sur un gel d'agarose 1% (tampon 
TAE). Apres coloration au bromure d'ethidium, deux bandes majeures sont revelees : 
une bande d'une taille d'environ 490 pb (taille attendue (voir Figure 6)) et une bande 
supplemental d'une taille d'environ 700 pb. Cette demiere est extraite du gel a I'aide 
du kit "geneclean" (Bio 101, ref 1001 400). Apres un dessalage sur une colonne de 
polyacrylamide P10 (Biorad, ref 15011050), le fragment est soumis a une nouvelle 
amplification par PCR durant 10 cycles comme decrit ci-dessus. 

4) Determination de la sequence du produit amplify 

Dans un premier temps, le produit PCR est elimine des oligonucleotides sur une 
colonne de sephacryl S400 (Pharmacia 17-0609-01) puis dessale sur une colonne de 
P10. La reaction de sequencage est realisee a I'aide du kit Applied Biosystems (ref. 
401 628) (373 DNA sequencer) avec Tamorce antisens. 

La sequence obtenue est identique a la sequence de I'ADNc SR-p70 (exemple II.4) 
avec une insertion de 198 pb entre les positions 217 et 218 (Figure 14). La sequence 
proteique N-terminale deduite (sequence denommee SR-p70d) est plus courte de 49 
acides amines avec une divergence des 13 premiers acides amines (sequence ID 
N°13). II y a done co-existence d'au moins deux transcrits differents SR-p70 comme 
deja decrit pour la lignee AtT-20 de souris. 
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B) Clonage du SR-p70 humain et mis en evidence cfun apm 

proteine SR-p70 humaine deduite presentan . ^ P ° Ur Une 

S R -P70d et une divergence dans J p ;~ ;r ~ —ale que le 

D Amplification specifique de I'ADNc du SR- P 70 par ,a technique dite de PGR 
•-'amplification a ete realisee comme decrit dans I'EXEMPLE Vii. a ■ 

ID N° 11) CC GTG AC (P ° S,t,on 160 ^ 176. sequence 

amorce antisens : GGC AGC TTG GGT CTC TCr /n * 

Figures). GG <P° s,tl °n 1993 a 1976. 

Apres elimination de I'exces d'amcrces sur colonne S400 et h** , 
P10. 1M. de I'echantillon est de nouveau soumi Tune PGR a ^ "* C °'° nne 

de composition suivante : V6C ' 6 Coup,e d 'a™rces 

amorce sens : TAT CTCG^ CTG TAG GTG GGT GAG GGC 
N° 1 1) ' (Position 263 a 280. sequence ID 

amorce antisens : ATA TCTAGA TCA GTG GAT CTC GGC CTC 

' (position 194 3 a 1926. Figure 6). 

2) Clonage du produit amplifle dans le plasmide pCDNAS 

I'EXEMPLE ,,.5 . Deux LZ ' PC ° NA3 «"» 

587a ad e, an, ines (sequence lD N . 1 f e ^^ a U P ™ te '™ *** 

1049 et 1050 d'une part et entre u. «„ •♦• - 4 Pb 6ntre ,es P° sition s 

M entre les positions 1 188 et 1 iaq h-». * 
N° 14 et Figure 15) La se 0 u„n~ *- °® d autre part (sequence ID 

- e ura protein Z^l l^eT ^ 
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sequence proteique entre les acides amines 350 et 397 (sequence ID N° 15 et Figure 
16) (sequence denommee SR-p70e). La proteine deduite comporte 506 acides 
amines. 

C) Mise en evidence d'un ARNm codant pour une proteine SR-p70 humaine deduite 
presentant une extremite N-terminale plus courte 

1) Culture des cellules SK-N-SH (neuroblastome humain) 

Les cellules sont cuitivees comme decrit dans le « catalogue of cell lines and 
hybridomas, 7th edition, 1992 » de I'ATCC (American Type Culture Collection). 

2) Preparation de I'ADNc et amplification de I'ADNc du SR-p70 par la technique dite 
de PCR 

Ces etapes sont realisees comme decrit dans I'EXEMPLE VIII.A avec le couple 
d'amorces de composition suivante: 

amorce sens : AGG GGA CGC AGC GAA ACC (position 128 a 145, Figure 

17) 

amorce anti sens :GGC AGC TTG GGT CTC TGG (position 1993 a 1976, Figure 

6). 

Le sequencage est realise avec le kit Applied Biosystem avec des amorces 
specifiques de I'ADNc du SR-p70 et revele deux ADNc : 

- un premier ADNc correspondant a I'ARNm codant pour le SR-p70a 

- un second ADNc presentant une deletion de 98 pb entre les positions 24 et 25 
(sequence ID N° 16 et Figure 15). 

Cette deletion comprend I'ATG d'initiation de traduction du SR-p70a. La proteine 
deduite (denommee SR-p70f) de ce second ADNc presente un ATG initiateur de 
traduction en aval correspondant a un ATG interne du SR-p70a. La proteine deduite 
comporte done 588 acides amines (sequence ID N° 17 et Figure 16) et est tronquee 
des 48 acides amines N-terminaux du SR-p70a. 

D) Mise en evidence d'un ARNm codant pour le SR-p70b humain. 



1) Culture des cellul s K562 
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Les cellules sont cultivees comme decrit dans le "catalogue of ~i. m. . 
^* 7 *^^ -rATCC (American Type 

» r^E^^ amP,,fiCati0n " '" ADNC " SR - P?0 ^ " * " 

Ces etapes sont realisees comme decrit dans I'EXEMPLE VIII. C. 
Le sequencage revele deux ADNc : 

Un premier ADNc correspondan, a I'ARNm codan, pour le SR. P 70a et un second 
ADNc presentan, une deletion de 94 pb entre les posttons 1516 e. 1517 (seou!^ 
; 18 - "*» 15 >- ^ *duit. (denommee SR. P 70b Z£?Z 

acdes am,nes e. present, un. sequence Cterminal. tronouee de 137 addes amine! 

Cet ADNc est similair. a dui decrit dans I'EXEMPLE [ relatif au SR-p70b de singe. 
Les molecules decntes dans cet example (EXEMPLE VIII. A. B. O et D) mettent en 

» i:,* 5 " au sR - p7 ° ^ * *-■« ~.l 

pnmaire transcnts par le gens SR-p70. 

Le SR-p70a est cod. parun ARNm compose de 14 axons (voir EXEMPLE VII) C ast 

lion / T SXOnS 11 " 13 ' Le SR - P7 °' 9S ' 4 usance de 

25 lr.lL l!r Me T '' eXl! ' enC9 * Varian ' S dU SR -" 70 * "»"*• "on 
exhausts, avec un. probabilite forte dexistence d'autres vahants De meme 

pasaux l,gnees dans lesquelles lis ont et. mis en evidence. En effet de, etudes 



SR P D '; 0 5 a ' a !i rae,hiOnine tfln " ia,i0n du SR -P 7 « «"»»POnd a une methionine interne du 
SR.p70a. suggeran, ,a possibilit. d'initiaton en ava! sur I'ARNm codan, pour ,e SR- 
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EXEMPLE IX 



Obtention d'une sequence 5" de I'ARNm SR-P70a humaine. 

1 ) Amplification de I'extremite de 5'de I'ADNc SR-P70 par PCR 
La culture cellulaire et les preparations d'ARN total et d'ADNc sont realisees comme 
decrit dans I'EXEMPLE VIII. 1 et 2. La matrice ARN est hydrolysee par incubation 5 
minutes a 65°C apres adjonction de 4 pi EDTA 500 mM et 4 pi NaOH 2N. 
L'echantillon est ensuite dessale sur colonne P10. L'ADNc est allonge en 3' avec une 
"queue" de dG comme decrit dans I'EXEMPLE l.3.d, dans un volume final de 40 pi. 
Apres adjonction de 4 pi EDTA 500 mM et 4 ul NaOH 2N, I'ADNc est incube a 65°C 
pendant 3 minutes puis dessale sur une colonne P10. L'amplification par PCR est 
realisee comme decrit dans I'EXEMPLE VIII.3 avec 8 pi d'ADNc et durant 30 cycles 
avec le couple d'amorces de composition suivante : 

amorce sens : CCCCCCCCCCCCCCN(ouNest egal a G.A ou T) 
amorce antisens : CCATCAGCTCCAGGCTCTC (position 1167 a 1149, Figure 
6). 

Apres elimination de I'exces d'amorces sur colonne S400 et dessalage sur colonne 
P10, 1 pi de l'echantillon est de nouveau soumis a un PCR avec le couple de 
composition suivante : 

amorce sens : CCCCCCCCCCCCCCN 

amorce antisens : CCAGGACAGGCGCAGATG (position 928 a 91 1 , Figure 6). 

L'echantillon, de nouveau passe sur une colonne S400 et une colonne P10, est 
soumis a une troisieme amplification durant 20 cycles avec le couple suivant : 
amorce sens : CCCCCCCCCCCCCCCN 

amorce antisens : CTTGGCGATCTGGCAGTAG (position 503 a 485, Figure 6). 
2) Determination de la sequence 5'ADNc SR-P70 

La sequence est realisee comme decrit dans I'EXEMPLE VIII.4). Cette sequence fait 
apparaitre un 5' non codant d'au moins 237 bases en amont de I'ATG d'initiation du 
SR-p70a (Figure 17). Par comparaison de cette sequence (obtenue a partir de la 
lignee IMR-32) avec celle obtenue a partir de la lignee HT-29 notamment (Figure 6). 
deux differences ponctuell s (Figure 17 : voir caracteres gras) sont mises en 
evidence (G ■» A et C 4 T) respectivement positionne a -20 et -30 de I'ATG 
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d'initiation du SR-p70a (Figures 6 et 17). Cette variabilite est situee au niveau de 
I'exon 2 (Figure 13). II n'est pas exclu que cette variabilite se retrouve egalement a 
I'interieur d'une phase codante consecutivement a un epissage alternatif comme 
decrit dans les EXEMPLES III chez la souris et VIII chez I'homme ou bien 
consecutivement a une initiation de la traduction sur un CTG (comme cela a ete 
demontre pour le FGFb (Proc. Natl. Acad. Sci USA, 1989. 86, 1836 - 1840). 
De meme, il n'est pas exclu que cette variabilite ait une implication sur la traduction du 
SR-p70 ou sur I'epissage de I'ARN primaire. 

En tout etat de cause, cette variabilite, probablement d'origine allelique, peut servir de 
marqueur soit au niveau genomique (voir EXEMPLE XI). soit au niveau de I'ARNm 
(voir EXEMPLE X). 

EXEMPLE X 

1) Analyse par PCR, de /'expression transchptionnelle du SR-P70a dans les 
echantillons cellulaires (RT-PCR) 

Les cultures cellulaires (SK-N-AS, SK-N-MC. HT-29. U-373MG, SW480. IMR-32, 
CHP212) sont realisees comme decrit dans I'exemple VI. 1. a (referees au catalogu 
"catalogue of cell lines and hybridomas. 7th edition" 1992 de I'ATCC). 
La preparation de I'AONc et ('amplification par PCR sont realisees comme decrit dans 
I'exemple VIII.2 et 3. Le couple d'amorce utilise est de composition suivante : 
amorce sens: AGGGGACGCAGCGAAACC (position 128 a 145. Figure 17) 
amorce antisens : GGCAGCTTGGGTCTCTGG (position 1993 a 1976 Figure 
6). 

Les echantillons sont analyses par electrophorese sur un gel d'agarose 1% et 
revelation au Bromure d'ethidium (Figure 18). 

La taille de la bande obtenue dans les echantillons correspond a la taille attendue 
(environ 2 kb. Figures 6 et 17). L'intensite des bandes obtenues est reproductible. 
Une ^amplification de 1 ul de I'echantillon dans les memes conditions durant 20 
cycles fait apparaitre une bande dans chacun des echantillons. 

2) Determination de la sequence des produits amplifies 

Apres passage des echantillons sur colonnes S400 et P10. le sequencage est realise 
sur le sequenceur 373 de Applied Biosystems avec le kit de reference 401 628. Les 
amorces utilis es sont entre autres les suivantes : 
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position fig Ur e 
AGGGGACGCAGCGAAACC 128 a 145 22 

CTTGGCGATCTGGCAGTAG 503 a 485 6 

GATGAGGTGGCTGGCTGGA 677 a 659 6 

CCATCAGCTCCAGGCTCTC 1167 a 1149 6 

TGGTCAGGTTCTGCAGGTG 1605 a 1587 6 

GGCAGCTTGGGTCTCTGG 1993 a 1976 6 

Aucune difference proteique du SR-p70a n'a ete decelee. Cependant, tes sequences 
obtenues font apparattre une double variabilite aux positions -20 et -30 en amont de 
I'ATG d'initiation du SR-p70a (Figures 6 et 17). Cette variabilite, probablement 
d'origine allelique, permet de definir deux classes de transcrits : une premiere classe 
presentant un G a la position -30 et un C a la position -20 (classe G- 30 /C" 20 ) et une 
seconde classe presentant une difference aux deux positions : un A en -30 et un T en 
-20 (classe A- 30 /T-20). 

Premiere classe : SK-N-AS. SK-N-MC, HT-29, U-373MG, SW480. 
Deuxieme classe : IMR-32, CHP212. 



EXEMPLE Xt 

Methode d'analyse pour la determination de la repartition allelique du gene SR-p70 
dans un echantillonnage de 10 personnes. 

Cette repartition allelique est basee sur la variabilite allelique mise en evidence dans 
les examples IXetX: 

• Allele G- 30 /C- 20 presentant respectivement un G et un C aux positions -30 et -20 
en amont de I'ATG d'initiation du SR-p70a. 

• Allele A-30/T-20 presentant respectivement un A et un T aux memes positions. 
Cette variabilite peut etre mise en evidence par I'utilisation d'enzymes de restriction 
differenciant les deux alleles (Figure 13). A titre d'exemple : 

• Enzyme Bpl I presentant un site de coupure uniquement sur I'ailele G- 30 /C-20 
dans la zone d'interet (ce site englobe les deux positions variables). 

• Enzyme Styl presentant un site de coupure uniquement sur I'ailele a- 3O /T* 2 0 dans 
la zone d'interet. 
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V Amplification genomique de i'exon 2 par PCR 



La reaction de polymerisation est realisee, avec 500 ng d'ADN Q , nn • 
dans 50 pi final avec les conditio ^ . genomique purif/e 

h i<*. avec les conditions decntes dans I'exemple Vlil 3 

Le couple d'amorces est de composition suivante : 



CACCTACTCCAGGGATGC (position 1 41 - F 
a^ceantisens: AGGAAAATAGAAGCGTCAGTC £T «l«T^ 13 , 



La reaction est realisee durant 30 cycles comme decrit dans I'EXEMPLE VII, 3 

Apres eliminate de I'exces d'amorce sur une colonne S400 ef H 

colonne de P10 1 ul de l'ech«ntii.«„ ♦ «"°nne S400 et dessalage sur une 

• u, t ui oe ecnantillon est amplifies de nouveau dnr an » r»c 
les memes conditions avec ,e coup,e d'amorces su,van. ^ *" 

amorce sens: CAGGCCCACTTGCCTGCC (position 25 a,, =■ 

amorcean«sens: CTGTCCCCAAGCTGATGAG ^«\^ETl3,. 

£ ^ ^ ^ " " ge, d,garose 1% 

2; par /'enzyme de restriction Styi 

produits d e digest son. analyses par i£~ZA f 30 m " Us 

(tampon TAE). La revelation est J Z- ^ r ° Ph0rese sur un 8el d'agarose 1% 
(Figure 19-8). Par C °' 0ra,ion au bro ™"» 

d ethidium 

Une bande de 482 palres de bases caracterise ralieie G-30 /c -20 , Fi „ „ 

La presence d'une bande de 376 oaire. ^. h " flares 13 et 19). 

^scara^sentraneJ ^Z^Z", ^ 106 P *« * 

Sur 1'echanti.lonnag. de ,0 personnel 2 1 * C ° UPUre SW 

e. A-30/T-20 ,„ " a J ,'° personnes - 2 Pannes presentent !es alleles G-30 /c -20 

he,erozygo,es present, les a,le,es U/C ™-30^o , T" ' PerS ° nTOS 
etant homozygotes pour I'allele G-30/ C -20 ' autres P erso ™es 
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EXEMPLE XII 

Test de reversion de transformation de fa lignee SK-N-AS par transfection avec 
I'ADNc SR-p70. 

Le vecteur ^expression utilise est decrit dans i'EXEMPLE 11.5 et schematise dans la 
figure 15. La methode utilises est cede dite du phosphate de calcium decrite par 
Graham et al. (Virology 1973, 54, 2. 536-539). La lignee est ensemencee a raison de 
5.10 s cellules par boite de 6 cm de diametre dans 5 ml du milieu decrit dans 
I'exemple I.1.. Les cellules sont mises en culture a 37°C et a 5% de CO2 pendant une 
nuit. Le milieu de transfection est prepare de la maniere suivante : le melange suivant 
est realise en ajoutant dans I'ordre 1 ml de tampon HEBS (NaCI 8 mg/ml, KCI 370 
ug/ml, Na 2 HP0 4 -2H 2 0 125 Mg/ml, Dextrose 1 mg/ml, Hepes pH 7,05 5 mg/ml), 10 ug 
du plasmide a transferer et 50 ul CaCl2 2,5 M ajoute goutte a goutte. Le milieu de 
transfection est laisse 30 mn a temperature ambiante puis ajoute goutte a goutte sur 
le milieu contenu dans la boite de culture. Les cellules sont incubees 5 a 6 heures a 
37° C/5% CO2. Apres aspiration du milieu, 5 ml de milieu frais contenant 2% de 
serum du bovin foetal sont ajoutes. Apres 48 heures a 37° C/5% C0 2 . les cellules 
sont rincees avec du PBS. decollees par trypsinisation, diluees dans 10 ml de milieu 
de culture (5% serum de bovin foetal) et etalees dans une boite de 10 cm de diametre 
(la dilution peut etre ajustee en fonction de I'efficacite de transfection). Apres une 
nouvelle incubation durant 10 heures (le temps que les cellules adherent), les cellules 
sont passees en selection par adjonction de G418 a la concentration finale de 600 
ug/ml equivalent geneticine durant 15 a 21 jours (le milieu est change tous les jours). 
Les clones obtenus sont alors rinces au PBS. fixes a I'ethanol 70%, seches, colores 
avec 1 % de cristal violet, puis comptabilises. 
Quatre transfections plasmidiques ont ete realisees en double : 

- plasmide pCDNA3 sans insert 

- plasmide pCDNA3/SR-p70 contenant I'ADNc - SR-P70a humaine 

- plasmide pCDNA3/SR-p70 Mut contenant I'ADNc - SR-p70a presentant une 
mutation a la position 293 AA (R H) qui est analogue a la mutation 273 (R 
H) dans le domaine de fixation a I'ADN de la p53 

- temoin sans plasmide. 



Le resultat est exprime en nombre de clones par boit 
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Le nombre de donas obtenu par transfection avec le plasmide pCDNa^p y n 
* 25 fois inf,neur au nombre de .ones obtenu avec le' *J on ^Te^l f T s 
.nfeneur au nombre de clones obtenu avec le pcDNA3/SR d70 y, 7 
— ou un arr, de division cellulaire des 'JZZ^^ZZ 17 

avec rloNc SR ^ ^ C ° nS ' qU6nCe ^ ^ ™ *• 

avec lADNc SR-p70 mute mais probablement d'une apoptose mmmB , 

~ po. ,a p rot *ne pS3 (Kokand e, a, S=,enc es .TC 262 ~ ■ * 



EXEMPLE XIII 



R6le biologique de fa proteine SR-p70. 



L'homologie de structure entre le domaine de fixation a I'ADN de ,a d53 •»,.,•• 

permet la taaon aux sequences d'ADN specifiques situes danlT 
sw^^xaHsdM^dans'^ett 1 * 8 m ^^^ flotations ponrtuelles^nactlvant^'pSS 

„ m , . . inainaut p., Current Opinion in Oncoloav 1995 7 7r oo 

Prokoamer M.. Blood. 1994, 84 n'8. 2391-2411) ' 2 ' 

z^rxrzz: p5 r SR - p7 ° est s, ~ — - - - 

sugg.rant que ll SR-p70 s ™ * S directement <ans .'interaction . I'ADN 

P70 s f,x aux s,tes p53 sur I'ADN. Ces acides amines 
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correspondent tres exactement a ce qu'on appelle les "hot spot", acides amines 
frequemment mutes dans les tumeurs humaines (SWISS PROT : SW : P53_human et 
Prokocimer M., Blood, 1994. 84 n'8, 2391-2411). De cette homoiogie, on peut deduire 
que la proteine SR-p70 exerce un controle sur I'activite des genes regules par la p53, 
soit independamment de celle-ci soit en formant des heterooligomeres avec cette 
derniere. 

En consequence, a I'instar de la p53, les produits du gene SR-p70 doivent etre 
impliques dans le contrdle et la regulation du cycle cellulaire provoquant des arrets 
du cycle (momentanes ou definitifs), et la mise en oeuvre de programmes tels que : la 
reparation de I'ADN, la differenciation ou la mort cellulaire. L'existence d'activites 
"p53-like" avait ete fortement pressentie avec la mise en evidence chez les souris 
P53-/-, d'activites de reparation de I'ADN et de mort cellulaire en reponse aux 
radiations ionisantes (Strasser er a/.. Cell, 1994. 79, 329-339). Les auteurs de la 
presente invention ont localise le gene SR-p70 humain dans la region telomerique du 
bras court du chromosome 1, precisement en 1p36.2-36.3, la plus petite region 
deletee (SRO) commune a une majorite de neuroblastomes et d'autres types de 
tumeurs (meianomes et carcinomes) (White er a/., PNAS, 1995, 92, 5520-5524). 
Cette region de perte d'heterozygotie (LOH) delimite le locus d'un gene suppresseur 
de tumeur dont la perte d'activite serait la cause de la formation des tumeurs. II est 
important de rappeler que cette region est egalement sujette a "I'empreinte 
maternelle" ; I'allele matemel est preferentiellement perdu dans les neuroblastomes 
presentant la deletion 1p36 (sans amplification de N-Myc) (Caron er a/., Hum. Mol. 
Gen.. 1995, 4, 535-539). Le gene sauvage SR-p70 introduit et exprime dans des 
cellules de neuroblastome permet la reversion de leur transformation. La perte de 
cette activite anti-oncogenique est done associee au developpement de la tumeur. La 
region 1p36 presente une homoiogie syngenique avec le segment distal du 
chromosome 4 de souris. Dans cette region a ete localise le gene curly tail (ct) (Beier 
et ai, Mammalian Genome, 1995. 6, 269-272) implique dans les malformations 
congenitales du tube neural (MTN : spida bifida, anencephalie...). La souris ct est le 
meilleur modele animal d'etude de ces malformations. II est admis que ces 
malformations resultent d'anomalies de la proliferation cellulaire. Compte tenu de la 
nature du gene SR-p70 et de sa localisation chromosomique. une des hypotheses est 
que le SR-p70 pourrait etre I'homologue humain de ct et qu'a ce titre, la detection des 
mutations precoces et les anomalies chromosomiques concemant ce gene devraient 
permettre par exemple comme application, ('identification des personnes a risques 
(0.5-1 % des nouveaux-nes atteints par MTN), et la mise en oeuvre de traitements 
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preventifs (Neumann et a/.. Nature Genetics, 1994, 6, 357-362 ; Di Vinci et a/.. Int. J 
Cancer, 1994, 59, 422-426 ; Moll era/., PNAS, 1995, 92, 4407-4411 ; Chen et al. 
Development, 1995. 121, 681-691). 



EXEMPLE XIV 

Etude alielique du gene SR-p70. 

Les alleles GC et AT sont identifies aisement par restriction Styl des produits PCR de 
I'exon 2 (voir exemple XI). On a done pu determiner ainsi, chez des individus 
heterozygotes GC/AT et porteurs de tumeurs neuroblastomes, I'allele SR-p70 
perdu (GC ou AT) et cela malgre la presence de tissu contaminant sain. 
D une facon surprenante, lorsque la meme analyse est realisee sur I'ARN, un seul 
allele est mis en evidence independamment de presence ou non d'une deletion et 
plus surprenant encore, malgre la presence de tissu sain. Cela suggere que 
I'empreinte (expression differentielles des deux alleles) existerait egalement dans le 
tissu contaminant. 

Pour le verifier, on a repete la meme analyse sur de I'ARN provenant des cellules 
sanguines d'individus sains heterozygotes GC/AT. Un seul des deux types de transcrit 
a ete detecte egalement dans ces cellules. Ce resultat confirme I'observation faite sur 
les echantillons tumoraux quant a I'existence d'une empreinte genetique generalisee 
pour le gene SR-p70. 

Les implications de cette decouverte sont importantes puisqu'elle permet de postuler 
qu'une seule mutation sporadique inactivant I'allele actif SR-p70 entrainera une perte 
d'activite et cela potentiellement dans tous les tissus. 

L'absence de donnees precises sur la fonction biologique SR-p70 ne permet pas de 
mesurer les consequences de cette perte d'activite SR-p70 pour la cellule. 
Neanmoins. sa forte homologie avec la proteine suppresses de tumeur p53. ainsi 
que la demonstration que la SR-p70 est un facteur de transcription capable d'utiliser 
le promoteur P2^, suggere un role de cette proteine dans le controle du cycle 
cellulaire et dans la differentiation. 

Knudson and Meadows 1980 (New Eng. J. Med. 302 : 1254-56) considerent les 
neuroblastomes IV-S comme une collection de cellules non malignes de la crete 
neurale portant une mutation qui interfere avec leur differ ncation normale. 
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II est concevable qu la perte d'activite SR-p70 tout comme la perte du controls p53 
sur le cycle cellulaire favorise I'apparition d'anomalies cellulaires telles que 
I'aneuploi'die, I'amplification (decrites dans le cas des neuroblastomes) et d'autres 
remaniements genetiques pouvant provoquer la transformation cellulaire (Livingstone 
et al. 1992. Cell 71 : 923-25 ; Yin et al. 1992. Cell 72:937-48; Cross et al. 1995, 
Science 267:1353-56; Fukasawa et al. 1996, science 271:1744-47). i_es 
neuroblastomes pourraient done provenir a leur origine d'une perte d'activite 
temporaire ou definitive de la SR-p70. favorisant ainsi I'apparition d'evenements 
oncogeniques et done la progression tumorale. 

Dans le cas de la deletion constitutionnelle 1p36 decrite par Biegel et al. 1993 (Am. J. 
Hum. Genet. 52 : 176-82). il y a bien apparition de neuroblastome IV-S. et le gene 
concerne est NBS-1 (SR-p70). 

En conclusion, ce qui est decrit pour les neuroblastomes pourrait egalement 
sappliquer a d'autres types de tumeurs notamment ceux associes a des 
remaniements de I'extremite du bras court du chromosome 1 (report 2 international 
workshop on human chr 1 mapping 1995, Cytogenetics and Cell Genet. 72 : 113-154). 
Sur un plan therapeutique, I'implication de la SR-p70 dans I'apparition de tumeurs 
devrait conduire a eviter I'utilisation d'agents mutagenes en chimiotherapie, compte 
tenu des risques de transformation cellulaire par ces produits. et leur preferer des 
substances non mutagenes qui stimulent la differenciation. 

D'autre part, la frequence d'apparition des alleles GC et AT est la suivante : dans la 
population, Frequence(AT)=0.15 et sur un echantillon de 25 patients 
(neuroblastomes), F(AT)=0.30. Ces statistiques indiquent que I'allele AT pourrait etre 
un facteur de predisposition. 
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LISTE DE SEQUENCES 



(1) INFORMATION GENE RALE : 

(i) DEPOSANT: 

(A) NOM: sanofi 

(B) RUE: 32-34 rue Marbeuf 

(C) VILLE: PARIS 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 75008 

(G) TELEPHONE: 01 53 77 40 00 

(H) TELECOPIE: 01 53 77 41 33 

(ii) TITRE DE L' INVENTION: SR-p70 
(iii) NOMBRE DE SEQUENCES: 40 

(iv) FORME LISIBLE PAR ORD I NATEUR : 

(A) TYPE DE SUPPORT: Floppy disk 

(B) ORD I NATEUR : IBM PC compatible 

(C) SYSTEME D ' EXPLOITATION: PC-DOS/MS-DOS 

(D) LOGICIEL: Patentln Release #1.0, Version #1.25 (OEB) 



(2) INFORMATION POUR LA SEQ ID NO: 1: 

(i) CARACTERI STIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2874 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN- 

(vi) ORIGINE: 

(A) ORGANISME: Cebus apella 

(ix) CARACTERI STIQUE ADDITIONELLE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 156.. 2066 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 1: 

TGCCTCCCCG CCCGCGCACC CGCCCCGAGG CCTGTGCTCC TGCGAAGGGG ACGCAGCGAA 60 

GCCGGGGCCC GCGCCAGGCC GGCCGGGACG GACGCCGATG CCCGGAGCTG CGACGGCTGC 120 

AGAGCGAGCT GCCCTCGGAG GCCGGTGTGA GGAAG ATG GCC CAG TCC ACC ACC 173 

Met Ala Gin Ser Thr Thr 
1 5 

ACC TCC CCC GAT GGG GGC ACC ACG TTT GAG CAC CTC TGG AGC TCT CTG 221 
Thr Ser Pro Asp Gly Gly Thr Thr Phe Glu His Leu Trp Ser Ser Leu 
10 15 20 

GAA CCA GAC AGC ACC TAC TTC GAC CTT CCC CAG TCA AGC CGG GGG AAT 2 69 

Glu Pro Asp Ser Thr Tyr Phe Asp Leu Pro Gin Ser Ser Arg Gly Asn 
25 30 35 

AAT GAG GTG GTG GGT GGC ACG GAT TCC AGC ATG GAC GTC TTC CAC CTA 317 
Asn Glu Val Val Gly Gly Thr Asp Ser Ser Met Asp Val Phe His Leu 
40 45 50 

GAG GGC ATG ACC ACA TCT GTC ATG GCC CAG TTC AAT TTG CTG AGC AGC 365 
Glu Gly Met Thr Thr Ser Val Met Ala Gin Phe Asn Leu Leu Ser Ser 
55 60 65 70 

ACC ATG GAC CAG ATG AGC AGC CGC GCT GCC TCG GCC AGC CCG TAC ACC 413 
Thr Met Asp Gin Met Ser Ser Arg Ala Ala Ser Ala Ser Pro Tyr Thr 
75 80 85 
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CCG GAG CAC GCC GCC AGC GTG CCC ACC CAT TCA CCC TAC GCA CAG CCC 4 61 

Pro Glu His Ala Ala Ser Val Pro Thr His Ser Pro Tyr Ala Gin Pro 
90 95 100 

AGC TCC ACC TTC GAC ACC ATG TCG CCC GCG CCT GTC ATC CCC TCC AAC 509 
Ser Ser Thr Phe Asp Thr Met Ser Pro Ala Pro Val He Pro Ser Asn 
105 HO 115 

ACC GAC TAT CCC GGA CCC CAC CAC TTC GAG GTC ACT TTC CAG CAG TCC 557 
Thr Asp Tyr Pro Gly Pro His His Phe Glu Val Thr Phe Gin Gin Ser 
120 125 130 

AGC ACG GCC AAG TCA GCC ACC TGG ACG TAC TCC CCA CTC TTG AAG AAA 605 
Ser Thr Ala Lys Ser Ala Thr Trp Thr Tyr Ser Pro Leu Leu Lys Lys 
135 140 145 150 

CTC TAC TGC CAG ATC GCC AAG ACA TGC CCC ATC CAG ATC AAG GTG TCC 653 
Leu Tyr Cys Gin He Ala Lys Thr Cys Pro He Gin He Lys Val Ser 
155 160 165 

GCC CCA CCG CCC CCG GGC ACC GCC ATC CGG GCC ATG CCT GTC TAC AAG 701 
Ala Pro Pro Pro Pro Gly Thr Ala He Arg Ala Met Pro Val Tyr Lys 
170 175 180 

AAG GCG GAG CAC GTG ACC GAC ATC GTG AAG CGC TGC CCC AAC CAC GAG 74 9 

Lys Ala Glu His Val Thr Asp He Val Lys Arg Cys Pro Asn His Glu 
185 190 195 

CTC GGG AGG GAC TTC AAC GAA GGA CAG TCT GCC CCA GCC AGC CAC CTC 797 
Leu Gly Arg Asp Phe Asn Glu Gly Gin Ser Ala Pro Ala Ser His Leu 
200 205 210 

ATC CGT GTG GAA GGC AAT AAT CTC TCG CAG TAT GTG GAC GAC CCT GTC 8 45 

He Arg Val Glu Gly Asn Asn Leu Ser Gin Tyr Val Asp Asp Pro Val 
215 220 225 230 

ACC GGC AGG CAG AGC GTC GTG GTG CCC TAT GAG CCA CCA CAG GTG GGG 8 93 

Thr Gly Arg Gin Ser Val Val Val Pro Tyr Glu Pro Pro Gin Val Gly 
235 240 245 

ACA GAA TTC ACC ACC ATC CTG TAC AAC TTC ATG TGT AAC AGC AGC TGT 941 
Thr Glu Phe Thr Thr He Leu Tyr Asn Phe Met Cys Asn Ser Ser Cys 
250 255 260 

GTG GGG GGC ATG AAC CGA CGG CCC ATC CTC ATC ATC ATC ACC CTG GAG 98 9 

Val Gly Gly Met Asn Arg Arg Pro He Leu He He He Thr Leu Glu 
265 270 275 

ACG CGG GAT GGG CAG GTG CTG GGC CGC CGG TCC TTC GAG GGC CGC ATC 1037 
Thr Arg Asp Gly Gin Val Leu Gly Arg Arg Ser Phe Glu Gly Arg He 
280 285 290 

TGC GCC TGT CCT GGC CGC GAC CGA AAA GCC GAT GAG GAC CAC TAC CGG 1085 
Cys Ala Cys Pro Gly Arg Asp Arg Lys Ala Asp Glu Asp His Tyr Arg 
295 300 305 310 

GAG CAG CAG GCC TTG AAT GAG AGC TCC GCC AAG AAC GGG GCT GCC AGC 1133 
Glu Gin Gin Ala Leu Asn Glu Ser Ser Ala Lys Asn Gly Ala Ala Ser 
315 320 325 

AAG CGC GCC TTC AAG CAG AGT CCC CCT GCC GTC CCC GCC CTG GGC CCG 1181 
Lys Arg Ala Phe Lys Gin Ser Pro Pro Ala Val Pro Ala Leu Gly Pro 
330 335. 340 

GGT GTG AAG AAG CGG CGG CAC GGA GAC GAG GAC ACG TAC TAC CTG CAG 1229 
Gly Val Lys Lys Arg Arg His Gly Asp Glu Asp Thr Tyr Tyr Leu Gin 
345 350 355 

GTG CGA GGC CGC GAG AAC TTC GAG ATC CTG ATG AAG CTG AAG GAG AGC 1277 
Val Arg Gly Arg Glu Asn Phe Glu He Leu Met Lys Leu Lys Glu Ser 
360 365 370 
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CTG GAG CTG ATG GAG TTG GTG CCG CAG CCG CTG GTA GAC TCC TAT CGG 
Leu Glu Leu Met Glu Leu Val Pro Gin Pro Leu Val Asp Ser Tyr Ara 
375 380 385 390 

CAG CAG CAG CAG CTC CTA CAG AGG CCG AGT CAC CTA CAG CCC CCA TCC 
Gin Gin Gin Gin Leu Leu Gin Arg Pro Ser His Leu Gin Pro Pro Ser 
395 400 405 

TAC GGG CCG GTC CTC TCG CCC ATG AAC AAG GTG CAC GGG GGC GTG AAC 
Tyr Gly Pro Val Leu Ser Pro Met Asn Lys Val His Gly Gly Val Asn 
410 415 420 

AAG CTG CCC TCC GTC AAC CAG CTG GTG GGC CAG CCT CCC CCG CAC AGC 
Lys Leu Pro Ser Val Asn Gin Leu Val Gly Gin Pro Pro Pro His Ser 
425 430 435 

TCG GCA GCT ACA CCC AAC CTG GGA CCT GTG GGC TCT GGG ATG CTC AAC 
Ser Ala Ala Thr Pro Asn Leu Gly Pro Val Gly Ser Gly Met Leu Asn 
440 445 450 

AAC CAC GGC CAC GCA GTG CCA GCC AAC AGC GAG ATG ACC AGC AGC CAC 
Asn His Gly His Ala Val Pro Ala Asn Ser Glu Met Thr Ser Ser His 
455 460 465 470 



TAC CAC GCC GAC CCC AGC CTC GTC AGT TTT TTA ACA GGA TTG GGG TGT 
Tyr His Ala Asp Pro Ser Leu Val Ser Phe Leu Thr Gly Leu Gly Cvs 
490 495 500 

CCA AAC TGC ATC GAG TAT TTC ACG TCC CAG GGG TTA CAG AGC ATT TAC 
Pro Asn Cys lie Glu Tyr Phe Thr Ser Gin Gly Leu Gin Ser lie Tyr 
505 sio 515 

CAC CTG CAG AAC CTG ACC ATC GAG GAC CTG GGG GCC CTG AAG ATC CCC 
His Leu Gin Asn Leu Thr lie Glu Asp Leu Gly Ala Leu- Lys He Pro 
520 525 530 

GAG CAG TAT CGC ATG ACC ATC TGG CGG GGC CTG CAG GAC CTG AAG CAG 
Glu Gin Tyr Arg Met Thr He Trp Arg Gly Leu Gin Asp Leu Lys Gin 
535 540 545 550 

GGC CAC GAC TAC GGC GCC GCC GCG CAG CAG CTG CTC CGC TCC AGC AAC 
Gly His Asp Tyr Gly Ala Ala Ala Gin Gin Leu Leu Arg Ser Ser Asn 
"5 560 565 

A?*T ^ f? C *T T TCC ATC «5C TCC GGG GAG CTG CAG CGC CAG CGG 

Ala Ala Ala lie Ser He Gly Gly Ser Gly Glu Leu Gin Arg Gin Arg 
570 575 580 



III a™ r n CC ^ TGC ** G 000 CGC ^G CAG CCC ATC AAG GAG GAG 
Phe Asp Leu Pro Asp Cys Lys Ala Arg Lys Gin Pro lie Lys Glu Glu 

bii> 620 625 630 

III Thr ^ C ^ G A T° CAC T GAGGGGCCG GGCCCAGCCA GAGCCTGTGC 

Phe Thr Glu Ala Glu He His 

635 

CACCGCCCAG AGACCCAGGC CGCCTCGCTC TCCTTCCTGT GTCCAAAACT GCCTCCGGAG 
GCAGGGCCTC CAGGCTGTGC CCGGGGAAAG GCAAGGTCCG GCCCATGCCC CGGCACCTCA 



1325 



1373 



1421 



1469 



1517 



1565 



GGC ACC CAG TCC ATG GTC TCG GGG TCC CAC TGC ACT CCG CCA CCC CCC 1613 
Gly Thr Gin Ser Met Val Ser Gly Ser His Cys Thr Pro Pro Pro Pro 
475 480 485 



1661 



1709 



1757 



1805 



1853 



1901 



vl? mI? ^ ^ C GT ? ^ TTC CGC GTG CGC CAC ACC ATC ACC ATC CCC 194 9 

Val Met Glu Ala Val His Phe Arg Val Arg His Thr He Thr He Pro 

585 590 595 

AAC CGC GGC GGC CCC GGC GCC GGC CCC GAC GAG TGG GCG GAC TTC GGC 
2E5f Gly Gly Pr ° Gly Ala Pro As P Glu Trp Ala Asp Phe Gly 

fcUU 605 J 



1997 

2045 

2096 

2156 
2216 
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CCGGCCCCAG GAGAGGCC C A GCCACCAAAG CCGCCTGCGG ACAGCCTGAG TCACCTGCAG 2276 

AACCTTCTGG AGCTGCCCTA ATGCT GGGCT TGCGGGGCAG GGGCCGGCCC ACTCTCAGCC 233 6 

CTGCCACTGC CGGGCGTGCT CCATGGCAGG CGTGGGTGGG GACCGCAGTG TCAGCTCCGA 2396 

CCTCCAGGCC TCATCCTAGA GACTCTGTCA TCTGCCGATC AAGCAAGGTC CTTCCAGAGG 2 45 6 

AAAGAATCCT CTTCGCTGGT GGACTGCCAA AAAGTATTTT GCGACATCTT TTGGTTCTGG 2516 

AGAGTGGTGA GCAGCCAAGC GACTGTGTCT GAAACACCGT GCATTTTCAG GGAATGTCCC 2576 

TAACGGGCTG GGGACTCTCT CTGCTGGACT TGGGAGTGGC CTTTGCCCCC AGCACACTGT 2 636 

ATTCTGCGGG ACCGCCTCCT TCCTGCCCCT AACAACCACC AAAGTGTTGC TGAAATTGGA 2 696 

GAAAACTGGG GAAGGCGCAA CCCCTCCCAG GTGC GGGAAG CATCTGGTAC CGCCTCGGCC 275 6 

AGTGCCCCTC AGCCTGGCCA CAGTCACCTC TCCTTGGGGA ACCCTGGGCA GAAAGGGACA 2816 

GCCTGTCCTX AGAGGACCGG AAATTGTCAA TATTTGATAA AATGATACCC TTTTCTAC 287 4 

(2) INFORMATION POUR LA SEQ ID NO: 2: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 637 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2: 

Met Ala Gin Ser Thr Thr Thr Ser Pro Asp Gly Gly Thr Thr Phe Glu 
1 5 .10 15 

His Leu. Trp Ser Ser Leu Glu Pro Asp Ser Thr Tyr Phe Asp Leu Pro 
20 25 30 

Gin Ser Ser Arg Gly Asn Asn Glu Val Val Gly Gly Thr Asp Ser Ser 
35 40 45 

Met Asp Val Phe His Leu Glu Gly Met Thr Thr Ser Val Met Ala Gin 
50 55 60 

Phe Asn Leu Leu Ser Ser Thr Met Asp Gin Met Ser Ser Arg Ala Ala 
65 70 75 80 

Ser Ala Ser Pro Tyr Thr Pro Glu His Ala Ala Ser Val Pro Thr His 
85 90 95 

Ser Pro Tyr Ala Gin Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala 
100 105 110 

Pro Val He Pro Ser Asn Thr Asp Tyr Pro Gly Pro His His Phe Glu 
115 120 125 

Val Thr Phe Gin Gin Ser Ser Thr Ala Lys Ser Ala Thr Trp Thr Tvr 
130 135 140 

Ser Pro Leu Leu Lys Lys Leu Tyr Cys Gin He Ala Lys Thr Cys Pro 
145 150 155 160 

He Gin He Lys Val Ser Ala Pro Pro Pro Pro Gly Thr Ala He Arg 
165 170 175 

Ala Met Pro Val Tyr Lys Lys Ala Glu His Val Thr Asp He Val Lys 
180 185 190 

Arg Cys Pro Asn His Glu Leu Gly Arg Asp Phe Asn Glu Gly Gin Ser 
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195 200 . 205 

Ala Pro Ala Ser His Leu He Arg Val Glu Gly Asn Asn Leu Ser Gin 
210 215 220 

Tyr Val Asp Asp Pro Val Thr Gly Arg Gin Ser Val Val Val Pro Tyr 
225 230 235 240 

Glu Pro Pro Gin Val Gly Thr Glu Phe Thr Thr He Leu Tyr Asn Phe 
245 250 255 

Met Cys Asn Ser Ser Cys Val Gly Gly Met Asn Arg Arg Pro He Leu 
260 265 270 

He He He Thr Leu Glu Thr Arg Asp Gly Gin Val Leu Gly Arg Arg 
275 280 285 

Ser Phe Glu Gly Arg He Cys Ala Cys Pro Gly Arg Asp Arg Lys Ala 
290 295 300 

Asp Glu Asp His Tyr Arg Glu Gin Gin Ala Leu Asn Glu Ser Ser Ala 
305 310 .315 320 

Lys Asn Gly Ala Ala Ser Lys Arg Ala Phe Lys Gin Ser Pro Pro Ala 
325 330 335 

Val Pro Ala Leu Gly Pro Gly Val Lys Lys Arg Arg His Gly Asp Glu 
340 345 350 

Asp Thr Tyr Tyr Leu Gin Val Arg Gly Arg Glu Asn Phe Glu He Leu 
355 360 365 

Met Lys Leu Lys Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gin Pro 
370 375 380 

Leu Val Asp Ser Tyr Arg Gin Gin Gin Gin Leu Leu Gin Arg Pro Ser 
385 390 395 400 

His Leu Gin Pro Pro Ser Tyr Gly Pro Val Leu Ser Pro Met Asn Lys 
405 410 415 

Val His Gly Gly Val Asn Lys Leu Pro Ser Val Asn Gin Leu Val Gly 
420 425 430 

Gin Pro Pro Pro His Ser Ser Ala Ala Thr Pro Asn Leu Gly Pro Val 
435 440 445 

Gly Ser Gly Met Leu Asn Asn His Gly His Ala Val Pro Ala Asn Ser 
450 455 460 

Glu Met Thr Ser Ser His Gly Thr Gin Ser Met Val Ser Gly Ser His 
465 470 475 480 

Cys Thr Pro Pro Pro Pro Tyr His Ala Asp Pro Ser Leu Val Ser Phe 
485 490 495 

Leu Thr Gly Leu Gly Cys Pro Asn Cys He Glu Tyr Phe Thr Ser Gin 
500 505 510 

Gly Leu Gin Ser He Tyr His Leu Gin Asn Leu Thr He Glu Asp Leu 
515 520 525 

Gly Ala Leu Lys He Pro Glu Gin Tyr Arg Met Thr He Trp Arg Glv 
530 535 540 

Leu Gin Asp Leu Lys Gin Gly His Asp Tyr Gly Ala Ala Ala Gin Gin 
545 550 555 560 

Leu Leu Arg Ser Ser Asn Ala Ala Ala He S r He Gly Gly Ser Gly 
565 570 575 

Glu Leu Gin Arg Gin Arg Val Met Glu Ala Val His Phe Arg Val Arg 
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580 58,5 590 

His Thr He Thr He Pro Asn Arg Gly Gly Pro Gly Ala Gly Pro Asp 
595 600 605 

Glu Trp Ala Asp Phe Gly Phe Asp Leu Pro Asp Cys Lys Ala Arg Lys 
610 615 620 

Gin Pro He Lys Glu Glu Phe Thr Glu Ala Glu He His - 
625 630 635 

(2) INFORMATION POUR LA SEQ ID NO: 3: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2034 paires de bases 

(B) TYPE: acide nucleique 

(C) N OMBRE DE BRINS: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(vi) ORIGINE: 

(A) ORGANISME: Cebus apella 

(ix) CARACTERISTIQUE ADDITIONELLE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 156.. 1652 



<xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3: 

TGCCTCCCCG CCCGCGCACC CGCCCCGAGG CCTGTGCTCC TGCGAAGGGG ACGCAGCGAA 60 

GCCGGGGCCC GCGCCAGGCC GGCCGGGACG GACGCCGATG CCCGGAGCTG CGACGGCTGC 120 

AGAGC GAGCT GCCCTCGGAG GCCGGTGTGA GGAAG ATG GCC CAG TCC ACC ACC 173 

Met Ala Gin Ser Thr Thr 
1 5 

ACC TCC CCC GAT GGG GGC ACC ACG TTT GAG CAC CTC TGG AGC TCT CTG 221 
Thr Ser Pro Asp Gly Gly Thr Thr Phe Glu His Leu Trp Ser Ser Leu 
10 15 20 



GAA CCA GAC AGC ACC TAG TTC GAC CTT CCC CAG TCA AGC CGG GGG AAT 
Glu Pro Asp Ser Thr Tyr Phe Asp Leu Pro Gin Ser Ser Arg Gly Asn 
25 30 35 



AGC TCC ACC TTC GAC ACC ATG TCG CCC GCG CCT GTC ATC CCC TCC AAC 
Ser Ser Thr Phe Asp Thr Met Ser Pro Ala Pro Val He Pro Ser Asn 
105 no us 



269 



AAT GAG GTG GTG GGT GGC ACG GAT TCC AGC ATG GAC GTC TTC CAC CTA 317 
Asn Glu Val Val Gly Gly Thr Asp Ser Ser Met Asp Val Phe His Leu 
40 45 50 

GAG GGC ATG ACC ACA TCT GTC ATG GCC CAG TTC AAT TTG CTG AGC AGC 365 
Glu Gly Met Thr Thr Ser Val Met Ala Gin Phe Asn Leu Leu Ser Ser 
55 60 65 70 

ACC ATG GAC CAG ATG AGC AGC CGC GCT GCC TCG GCC AGC CCG TAC ACC 413 
Thr Met Asp Gin Met Ser Ser Arg Ala Ala Ser Ala Ser Pro Tyr Thr 
75 80 85 

CCG GAG CAC GCC GCC AGC GTG CCC ACC CAT TCA CCC TAC GCA CAG CCC 4 61 

Pro Glu His Ala Ala Ser Val Pro Thr His Ser Pro Tyr Ala Gin Pro 
90 95 100 



509 



ACC GAC TAT CCC GGA CCC CAC CAC TTC GAG GTC ACT TTC CAG CAG TCC 557 
Thr Asp Tyr Pro Gly Pro His His Phe Glu Val Thr Phe Gin Gin Ser 
120 125 130 



AGC ACG GCC AAG TCA GCC ACC TGG ACG TAC TCC CCA CTC TTG AAG AAA 



605 
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Ser Thr Ala Lys Ser Ala Thr Trp Thr Tyr Ser Pro Leu Leu Lys Lys 
135 140 ' 145 150 

CTC TAG TGC CAG ATC GCC AAG ACA TGC CCC ATC CAG ATC AAG GTG TCC 653 
Leu Tyr Cys Gin lie Ala Lys Thr Cys Pro lie Gin He Lys Val Ser 
155 160 165 

GCC CCA CCG CCC CCG GGC ACC GCC ATC CGG GCC ATG CCT GTC TAC AAG 701 
Ala Pro Pro Pro Pro Gly Thr Ala lie Arg Ala Met Pro Val Tyr Lys 
170 175 180 

AAG GCG GAG CAC GTG ACC GAC ATC GTG AAG CGC TGC CCC AAC CAC GAG 74 9 

Lys Ala Glu His Val Thr Asp He Val Lys Arg Cys Pro Asn His Glu 
185 190 195 

CTC GGG AGG GAC TTC AAC GAA GGA CAG TCT GCC CCA GCC AGC CAC CTC 797 
Leu Gly Arg Asp Phe Asn Glu Gly Gin Ser Ala Pro Ala Ser His Leu 
200 205 210 

ATC CGT GTG GAA GGC AAT AAT CTC TCG CAG TAT GTG GAC GAC CCT GTC 845 
He Arg Val Glu Gly Asn Asn Leu Ser Gin Tyr Val Asp Asp Pro Val 
215 220 225 230 

ACC GGC AGG CAG AGC GTC GTG GTG CCC TAT GAG CCA CCA CAG GTG GGG 8 93 

Thr Gly Arg Gin Ser Val Val Val Pro Tyr Glu Pro Pro Gin Val Gly 
235 240 245 

ACA GAA TTC ACC ACC ATC CTG TAC AAC TTC ATG TGT AAC AGC AGC TGT 941 
Thr Glu Phe Thr Thr He Leu Tyr Asn Phe Met Cys Asn Ser Ser Cys 
250 255 260 

GTG GGG GGC ATG AAC CGA CGG CCC ATC CTC ATC ATC ATC ACC CTG GAG 98 9 

Val Gly Gly Met Asn Arg Arg Pro He Leu He He lie Thr Leu Glu 
265 270 275 

ACG CGG GAT GGG CAG GTG CTG GGC CGC CGG TCC TTC GAG GGC CGC ATC 1037 
Thr Arg Asp Gly Gin Val Leu Gly Arg Arg Ser Phe Glu Gly Arg lie 
280 285 290 

TGC GCC TGT CCT GGC CGC GAC CGA AAA GCC GAT GAG GAC CAC TAC CGG 1085 
Cys Ala Cys Pro Gly Arg Asp Arg Lys Ala Asp Glu Asp His Tyr Arq 
295 300 305 310 

GAG CAG CAG GCC TTG AAT GAG AGC TCC GCC AAG AAC GGG GCT GCC AGC 1133 
Glu Gin Gin Ala Leu Asn Glu Ser Ser Ala Lys Asn Gly Ala Ala Ser 
315 320 325 

AAG CGC GCC TTC AAG CAG AGT CCC CCT GCC GTC CCC GCC CTG GGC CCG 1181 
Lys Arg Ala Phe Lys Gin Ser Pro Pro Ala Val Pro Ala Leu Gly Pro 
330 335 340 

GGT GTG AAG AAG CGG CGG CAC GGA GAC GAG GAC ACG TAC TAC CTG CAG 122 9 

Gly Val Lys Lys Arg Arg His Gly Asp Glu Asp Thr Tyr Tyr Leu Gin 
345 350 3S5 

GTG CGA GGC CGC GAG AAC TTC GAG ATC CTG ATG AAG CTG AAG GAG AGC 1277 
Val Arg Gly Arg Glu Asn Phe Glu lie Leu Met Lys Leu Lys Glu Ser 
360 365 370 

CTG GAG CTG ATG GAG TTG GTG CCG CAG CCG CTG GTA GAC TCC TAT CGG 1325 
Leu Glu Leu Met Glu Leu Val Pro Gin Pro Leu Val Asp Ser Tyr Ara 
375 380 385 390 

CAG CAG CAG CAG CTC CTA CAG AGG CCG AGT CAC CTA CAG CCC CCA TCC 1373 
Gin Gin Gin Gin Leu Leu Gin Arg Pro Ser His Leu Gin Pro Pro Ser 
395 400 405 

TAC GGG CCG GTC CTC TCG CCC ATG AAC AAG GTG CAC GGG GGC GTG AAC 1421 
Tyr Gly Pro Val Leu Ser Pro Met Asn Lys Val His Gly Gly Val Asn 
410 415 420 

AAG CTG CCC TCC GTC AAC CAG CTG GTG GGC CAG CCT CCC CCG CAC AGC 14 69 
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Lys Leu Pro Ser Val Asn Gin Leu Val Gly Gin Pro Pro Pro His Se- 
425 430 . 435 

TCG GCA GCT ACA CCC AAC CTG GGA CCT GTG GGC TCT GGG ATG CTC AAC 1517 
Ser Ala Ala Thr Pro Asn Leu Gly Pro Val Gly Ser Gly Met Leu Asn 
440 445 45 0 

AAC CAC GGC CAC GCA GTG CCA GCC AAC AGC GAG ATG ACC AGC AGC CAC 15 65 

Asn His Gly His Ala Val Pro Ala Asn Ser Glu Met Thr Ser Ser His 
455 460. 465 470 

GGC ACC CAG TCC ATG GTC TCG GGG TCC CAC TGC ACT CCG CCA CCC CCC 1613 
Gly Thr Gin Ser Met Val Ser Gly Ser His Cys Thr Pro Pro Pro Pro 
475 480 485 

TAC CAC GCC GAC CCC AGC CTC GTC AGG ACC TGG GGG CCC TGAAGATCCC 1662 
Tyr His Ala Asp Pro Ser Leu Val Arg Thr Trp Gly Pro 
490 495 

CGAGCAGTAT C GC AT GAC C A TCTGGCGGGG CCTGCAGGAC CTGAAGCAGG GC CAC GAC T A 1722 

CGGCGCCGCC GC GC AGC AGC TGCTCCGCTC C AGC AAC GC G GCCGCCATTT C CATC GGC GG 1782 

CTCCGGGGAG CTGCAGCGCC AGC GGGTC AT GGAGGC C GTG CACTTCCGCG TGCGCCACAC 18 42 

CATCACCATC CCCAACCGCG GCGGCCCCGG CGCCGGCCCC GAC GAGTGGG CGGACTTCGG 1902 

CTTCGACCTG CCCGACTGCA AGGCCCGCAA GCAGCCCATC AAGGAGGAGT TC AC GGAGGC 1962 

C GAGATCC AC TGAGGGGCCG GGCCCAGCCA GAGC CTGTGC CACCGCCCAG AGACCCAGGC 2022 

CGCCTCGCTC TC 2Q34 

(2) INFORMATION POUR LA SEQ ID NO: 4: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 499 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4: 

Met Ala Gin Ser Thr Thr Thr Ser Pro Asp Gly Gly Thr Thr Phe Glu 
15 10 15 

His Leu Trp Ser Ser Leu Glu Pro Asp Ser Thr Tyr Phe Asp Leu Pro 
20 25 30 

Gin Ser Ser Arg Gly Asn Asn Glu Val Val Gly Gly Thr Asp Ser Ser 
35 40 45 

Met Asp Val Phe His Leu Glu Gly Met Thr Thr Ser Val Met Ala Gin 
50 55 60 

Phe Asn Leu Leu Ser Ser Thr Met Asp Gin Met Ser Ser Arg Ala Ala 
65 7 0 75 80 

Ser Ala Ser Pro Tyr Thr Pro Glu His Ala Ala Ser Val Pro Thr His 
85 90 95 

Ser Pro Tyr Ala Gin Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala 
100 105 no 

Pro Val lie Pro Ser Asn Thr Asp Tyr Pro Gly Pro His His Phe Glu 
115 120 125 

Val Thr Phe Gin Gin Ser Ser Thr Ala Lys Ser Ala Thr Trp Thr Tyr 
IJ0 135 140 - 
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Ser Pro Leu Leu Lys Lys Leu Tyr Cys Gin lie Ala Lys Thr Cys Pro 
145 150 155 160 

He Gin He Lys Val Ser Ala Pro Pro Pro Pro Gly Thr Ala He Arg 
165 170 175 

Ala Met Pro Val Tyr Lys Lys Ala Glu His Val Thr Asp He Val Lys 
130 185 190 

Arg Cys Pro Asn His Glu Leu Gly Arg Asp Phe Asn Glu Gly Gin Ser 
195 200 205 

Ala Pro Ala Ser His Leu He Arg Val Glu Gly Asn Asn Leu Ser Gin 
210 215 220 

Tyr Val Asp Asp Pro Val Thr Gly Arg Gin Ser Val Val Val Pro Tyr 
225 230 235 240 

Glu Pro Pro Gin Val Gly Thr Glu Phe Thr Thr He Leu Tyr Asn Phe 
245 250 255 

Met Cys Asn Ser Ser Cys Val Gly Gly Met Asn Arg Arg Pro He Leu 
260 265 270 

He He He Thr Leu Glu Thr Arg Asp Gly Gin Val Leu Gly Arg Aro 
275 280 285 

Ser Phe Glu Gly Arg He Cys Ala Cys Pro Gly Arg Asp Arg Lys Ala 
290 295 300 

Asp Glu Asp His Tyr Arg Glu Gin Gin Ala Leu Asn Glu Ser Ser Ala 
305 310 315 320 

Lys Asn Gly Ala Ala Ser Lys Arg Ala Phe Lys Gin Ser Pro Pro Ala 
325 330 335 

Val Pro Ala Leu Gly Pro Gly Val Lys Lys Arg Arg His Gly Asp Glu 
340 345 350 

Asp Thr Tyr Tyr Leu Gin Val Arg Gly Arg Glu Asn Phe Glu He Leu 
355 360 365 

Met Lys Leu Lys Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gin Pro 
370 375 380 

Leu Val Asp Ser Tyr Arg Gin Gin Gin Gin Leu Leu Gin Arg Pro Ser 
385 390 395 400 

His Leu Gin Pro Pro Ser Tyr Gly Pro Val Leu Ser Pro Met Asn Lys 
405 410 415 

Val His Gly Gly Val Asn Lys Leu Pro Ser Val Asn Gin Leu Val Gly 
420 425 430 

Gin Pro Pro Pro His Ser Ser Ala Ala Thr Pro Asn Leu Gly Pro Val 
435 440 445 

Gly ??f Gly Met Leu Asn A3n His G1 V His Ala Val Pro Ala Asn Ser 
450 455 460 

Glu Met Thr Ser Ser His Gly Thr Gin Ser Met Val Ser Gly Ser His 
465 470 475 480 

Cys Thr Pro Pro Pro Pro Tyr His Ala Asp Pro Ser Leu Val Arg Thr 
485 490 495 

Trp Gly Pro 



(2) INFORMATION POUR LA SEQ ID NO: 5: 
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(i) CARACTERISTIQUES DE LA SEQUENCE: 

<A> LONGUEUR: 2156 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

<vi) ORIGINE: 

(A) ORGANISME: Homo sapiens 

(ix) CARACTERISTIQUE ADDITIONELLE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 33.. 1940 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 5: 

GCGAGCTGCC CTCGGAGGCC GGCGTGGGGA AG ATG GCC CAG TCC ACC GCC ACC 53 

Met Ala Gin Ser Thr Ala Thr 
1 5 

TCC CCT GAT GGG GGC ACC ACG TTT GAG CAC CTC TGG AGC TCT CTG GAA 101 

Ser Pro Asp Gly Gly Thr Thr Phe Glu His Leu Trp Ser Ser Leu Glu 
10 15 20 

CCA GAC AGC ACC TAC TTC GAC CTT CCC CAG TCA AGC CGG GGG AAT AAT 14 9 

Pro Asp ser Thr Tyr Phe Asp Leu Pro Gin Ser Ser Arg Gly Asn Asn 
25 30 35 

GAG GTG GTG GGC GGA ACG GAT TCC AGC ATG GAC GTC TTC CAC CTG GAG 197 
Glu Val Val Gly Gly Thr Asp Ser Ser Met Asp Val Phe His Leu Glu 
40 45 50 55 

GGC ATG ACT ACA TCT GTC ATG GCC CAG TTC AAT CTG CTG AGC AGC ACC 245 
Gly Met Thr Thr Ser Val Met Ala Gin Phe Asn Leu Leu Ser Ser Thr 
60 65 70 

ATG GAC CAG ATG AGC AGC CGC GCG GCC TCG GCC AGC CCC TAC ACC CCA 293 
Met Asp Gin Met Ser Ser Arg Ala Ala Ser Ala Ser Pro Tyr Thr Pro 
75 80 85 

GAG CAC GCC GCC AGC GTG CCC ACC CAC TCG CCC TAC GCA CAA CCC AGC 341 
Glu His Ala Ala Ser Val Pro Thr His Ser Pro Tyr Ala Gin Pro Ser 
90 95 100 

TCC ACC TTC GAC ACC ATG TCG CCG GCG CCT GTC ATC CCC TCC AAC ACC 389 
Ser Thr Phe Asp Thr Met Ser Pro Ala Pro Val lie Pro Ser Asn Thr 
105 no us 

GAC TAC CCC GGA CCC CAC CAC TTT GAG GTC ACT TTC CAG CAG TCC AGC 4 37 

Asp Tyr Pro Gly Pro His His Phe Glu Val Thr Phe Gin Gin Ser Ser 
120 125 130 135 

ACG GCC AAG TCA GCC ACC TGG ACG TAC TCC CCG CTC TTG AAG AAA CTC 4 85 

Thr Ala Lys Ser Ala Thr Trp Thr Tyr Ser Pro Leu Leu Lys Lys Leu 
140 145 150 

TAC TGC CAG ATC GCC AAG ACA TGC CCC ATC CAG ATC AAG GTG TCC ACC 533 
Tyr Cys Gin He Ala Lys Thr Cys Pro He Gin He Lys Val Ser Thr 
155 160 165 

CCG CCA CCC CCA GGC ACT GCC ATC CGG GCC ATG CCT GTT TAC AAG AAA 581 
Pro Pro Pro Pro Gly Thr Ala He Arg Ala Met Pro Val Tyr Lys Lys 
170 175 180 

GCG GAG CAC GTG ACC GAC GTC GTG AAA CGC TGC CCC AAC CAC GAG CTC 629 
Ala Glu His Val Thr Asp Val Val Lys Arg Cys Pro Asn His Glu Leu 
185 190 195 

GGG AGG GAC TTC AAC GAA GGA CAG TCT GCT CCA GCC AGC CAC CTC ATC 677 
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Gly Arg Asp Phe Asn Glu Gly cln Se , r Ala Pro Ala Ser His 

210 



e 

215 



Irt vli Sy HI HI 25 S? S° l AT GTG GAT GAC CCT GTC ACC 
220 Tyr Val Asp As P Pro Va l Thr 

225 230 

SS £ SS £ £ 2? £ s £ SS £ £ SS £ SS £ 



725 



773 



Ph C ?£ {£ "J Tyr Met ?f - C ^ AGC TGT GTA 

250 Met Cys Asn Ser Ser Cys Val 

255 260 



917 



965 



SS fff £ £ £ £ £ £ £ £ £ £ £ £ 2! £ •« 

£ £ ss a; £ £ ss £ £ £ £ ss ss £ £ £ 

S 51 £ ss £ £ £ £ £ £ ss £ £ £ £ si 

305 310 

32 SS K £ 25 SS £ £ £ £ £ £ £ « - « 

3 20 325 

£ S £ £ SS £ £ £ £ £ - s £ SS £ S3 »« 

335 340 

£ ^ £ £ £ ss sj £ ss £ s £ £ £ ss « 

£ SS £ SS £ £ SS £ £ £ £ £ £ SS £ £ »» 

370 375 

SS 2S Met Glu 2u S? S G ^ ^ TG GT ? «= «C TAT CGG CAG 

38^ n Pr ° Val Ser T * r Gin 

385 390 

SS SS SS £ £ SS £ £ £ « £ « ccc cc= tcc « 1253 

395 u Gln Pro Pro Tyr 

400 405 

SS £ £ £ £ £ £ £ £ £ £ SS SJ £ £ £ - 
S £ £ £ £ SS £ £ SS SS £ £ S £ £ £ - 
S £ £ £ £ £ SS £ £ SS £ 5 £ £ £ £ 

450 455. 

-"25£££££«s»££££££ 

£ SS £ £ £ £ - E SS £ £ £ £ £ £ £ 

=CC «c C CC AGC CTC GTC », TTT TTA ACA GGA ITG GCC TGT CCA 



1397 



1445 



1493 



1541 
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His Ala Asp Pro Ser Leu Val Ser Phe Leu Thr Gly Leu Gly Cys Pro 
490 495 " 500 

AAC TGC ATC GAG TAT TTC ACC TCC CAA GGG TTA CAG AGC ATT TAC CAC 1589 
Asn Cys lie Glu Tyr Phe Thr Ser Gin Gly Leu Gin Ser lie Tyr His 
505 510 515 

CTG CAG AAC CTG ACC ATT GAG GAC CTG GGG GCC CTG AAG ATC CCC GAG 1637 
Leu Gin Asn Leu Thr He Glu Asp Leu Gly Ala Leu Lys He Pro Glu 
520 525 530 535 

CAG TAC CGC ATG ACC ATC TGG CGG GGC CTG CAG GAC CTG AAG CAG GGC 1685 
Gin Tyr Arg Met Thr He Trp Arg Gly Leu Gin Asp Leu Lys Gin Gly 
540 545 550 

CAC GAC TAC AGC ACC GCG CAG CAG CTG CTC CGC TCT AGC AAC GCG GCC 1733 
His Asp Tyr Ser Thr Ala Gin Gin Leu Leu Arg Ser Ser Asn Ala Ala 
555 560 565 

ACC ATC TCC ATC GGC GGC TCA GGG GAA CTG CAG CGC CAG CGG GTC ATG 1781 
Thr He Ser He Gly Gly Ser Gly Glu Leu Gin Arg Gin Arg Val Met 
570 575 580 

GAG GCC GTG CAC TTC CGC GTG CGC CAC ACC ATC ACC ATC CCC AAC CGC 1829 
Glu Ala Val His Phe Arg Val Arg His Thr He Thr He Pro Asn Arg 
585 590 595 

GGC GGC CCA GGC GGC GGC CCT GAC GAG TGG GCG GAC TTC GGC TTC GAC 18 77 

Gly Gly Pro Gly Gly Gly Pro Asp Glu Trp Ala Asp Phe Gly Phe Asp 
600 605 610 615 

CTG CCC GAC TGC AAG GCC CGC AAG CAG CCC ATC AAG GAG GAG TTC ACG 1925 
Leu Pro Asp Cys Lys Ala Arg Lys Gin Pro He Lys Glu Glu Phe Thr 
620 625 630 

GAG GCC GAG ATC CAC TGAGGGCCTC GCCTGGCTGC AGCCTGCGCC ACCGCCCAGA 1980 
Glu Ala Glu He His 
635 

GACCCAAGCT GCCTCCCCTC TCCTTCCTGT GTGTCCAAAA CTGCCTCAGG AGGCAGGACC 2040 

TTCGGGCTGT GCCCGGGGAA AGGCAAGGTC CGGCCCATCC CCAGGCACCT CACAGGCCCC 2100 

AGGAAAGGCC CAGCCACCGA AGCCGCCTGT GGACAGC CTG AGTCACCTGC AG AAC C 2156 



(2) INFORMATION POUR LA SEQ ID NO: 6: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 636 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 6: 

Met Ala Gin Ser Thr Ala Thr Ser Pro Asp Gly Gly Thr Thr Phe 
15 10 15 

His Leu Trp Ser Ser Leu Glu Pro Asp Ser Thr Tyr Phe Asp Leu 
20 25 30 

Gin Ser Ser Arg Gly Asn Asn Glu Val Val Gly Gly Thr Asp Ser 
35 40 45 

Met Asp Val Phe His Leu Glu Gly M t Thr Thr Ser Val Met Ala 
50 55 60 

Phe Asn Leu Leu Ser Ser Thr Met Asp Gin Met Ser Ser Arg Ala 
65 70 75 



Glu 

Pro 

Ser 

Gin 

Ala 
80 
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Ser Ala Ser Pro Tyr Thr Pro Glu His Ala Ala Ser Val Pro Thr His 
85 " 90 95 

Ser Pro Tyr Ala Gin Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala 
100 105 HO 

Pro Val He Pro Ser Asn Thr Asp Tyr Pro Gly Pro His His Phe Glu 
115 120 125 

Val Thr Phe Gin Gin Ser Ser Thr Ala Lys Ser Ala Thr Trp Thr Tyr 
130 135 140 

Ser Pro Leu Leu Lys Lys Leu Tyr Cys Gin He Ala Lys Thr Cys Pro 
i45 150 155 160 

He Gin He Lys Val Ser Thr Pro Pro Pro Pro Gly Thr Ala He Arg 
165 170 175 

Ala Met Pro Val Tyr Lys Lys Ala Glu His Val Thr Asp Val Val Lys 
180 185 190 

Arg Cys Pro Asn His Glu Leu Gly Arg Asp Phe Asn Glu Gly Gin Ser 
195 200 205 

Ala Pro Ala Ser His Leu He Arg Val Glu Gly Asn Asn Leu Ser Gin 
210 215 220 

Tyr Val Asp Asp Pro Val Thr Gly Arg Gin Ser Val Val Val Pro Tyr 
225 230 235 240 

Glu Pro Pro Gin Val Gly Thr Glu Phe Thr Thr He Leu Tyr Asn Phe 
245 250 255 

Met Cys Asn Ser Ser Cys Val Gly Gly Met Asn Arg Arg Pro He Leu 
260 265 270 

He He He Thr Leu Glu Met Arg Asp Gly Gin Val Leu Gly Arg Arg 
275 280 285 

Ser Phe Glu Gly Arg He Cys Ala Cys Pro Gly Arg Asp Arg Lys Ala 
290 295 300 

Asp Glu Asp His Tyr Arg Glu Gin Gin Ala Leu Asn Glu Ser Ser Ala 
305 310 315 320 

Lys Asn Gly Ala Ala Ser Lys Arg Ala Phe Lys Gin Ser Pro Pro Ala 
325 330 335 

Val Pro Ala Leu Gly Ala Gly Val Lys Lys Arg Arg His Gly Asp Glu 
340 345 35 0 

Asp Thr Tyr Tyr Leu Gin Val Arg Gly Arg Glu Asn Phe Glu He Leu 
355 360 365 

Met Lys Leu Lys Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gin Pro 
370 375 380 

Leu Val Asp Ser Tyr Arg Gin Gin Gin Gin Leu Leu Gin Arg Pro Ser 
385 390 395 400 

His Leu Gin Pro Pro Ser Tyr Gly Pro Val Leu Ser Pro Met Asn Lys 
405 410 415 

Val His Gly Gly Met Asn Lys Leu Pro Ser Val Asn Gin Leu Val Gly 
420 425 430 

Gin Pro Pro Pro His Ser Ser Ala Ala Thr Pro Asn Leu Gly Pro Val 
435 440 445 

Gly GlY Met L6U A3n Aan Hi3 Glv Hi3 Val Pro A 1 * Asn Gly 

450 455 460 



m 
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Glu Met Ser Ser Ser His Ser Ala Gin Ser Met Val Ser Gly Ser His 
465 470 475 480 

Cys Thr Pro Pro Pro Pro Tyr His Ala Asp Pro Ser Leu Val Ser Phe 
485 490 495 

Leu Thr Gly Leu Gly Cys Pro Asn Cys He Glu Tyr Phe Thr Ser Gin 
500 SOS 510 

Gly Leu Gin Ser He Tyr His Leu Gin Asn Leu Thr He Glu Asp Leu 
515 520 525 

Gly Ala Leu Lys He Pro Glu Gin Tyr Arg Met Thr He Trp Ara Glv 
530 535 540 

Leu Gin Asp Leu Lys Gin Gly His Asp Tyr Ser Thr Ala Gin Gin Leu 
545 550 555 560 

Leu Arg Ser Ser Asn Ala Ala Thr He Ser He Gly Gly Ser Gly Glu 
565 570 575 

Leu Gin Arg Gin Arg Val Met Glu Ala Val His Phe Arg Val Arg His 
580 585 590 

Thr He Thr He Pro Asn Arg Gly Gly Pro Gly Gly Gly Pro Asp Glu 
595 600 605 

Trp Ala Asp Phe Gly Phe Asp Leu Pro Asp Cys Lys Ala Arg Lys Gin 
610 615 620 

Pro He Lys Glu Glu Phe Thr Glu Ala Glu lie His 
625 630 635 

(2) INFORMATION POUR LA SEQ ID NO: 7: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2040 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(vi) ORIGINE: 

(A) ORGANISME: Mus musculus 

(ix) C ARACTERI S T I QUE ADD I T I ONELLE : 
(A) NOM/CLE: CDS 
<B) EMPLACEMENT: 124.. 1890 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 7: 

TGATCTCCCT GTGGCCTGCA GGGGACTGAG CCAGGGAGTA GATGCCCTGA GACCCCAAGG 60 

GACACCCAAG GAAACCTTGC TGGCTTTGAG AAAGGGATCG TCTCTCTCCT GCCCAAGAGA 120 

AGC ATG TGT ATG GGC CCT GTG TAT GAA TCC TTG GGG CAG GCC CAG TTC 168 
Met Cys Met Gly Pro Val Tyr Glu Ser Leu Gly Gin Ala Gin Phe 
1 5 10 15 

AAT TTG CTC AGC AGT GCC ATG GAC CAG ATG GGC AGC CGT GCG GCC CCG 216 
Asn Leu Leu Ser Ser Ala Met Asp Gin Met Gly Ser Arg Ala Ala Pro 
20 25 30 

GCG AGC CCC TAC ACC CCG GAG CAC GCC GCC AGC GCG CCC ACC CAC TCG 2 64 

Ala Ser Pro Tyr Thr Pro Glu His Ala Ala Ser Ala Pro Thr His Ser 
35 40 45 

CCC TAC GCG CAG CCC AGC TCC ACC TTC GAC ACC ATG TCT CCG GCG CCT 312 
Pro Tyr Ala Gin Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala Pro 
50 55 60 
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SS S SS i£ S £ SS - S5 « s SS S S? S5 '« 

s ss as as s s s s^ g? s s s s s ss s «• 

0:3 90 g5 

CCA CTC TTG AAG AAG TTG TAC TGT CAG ATT GCT AAG ACA TGC rrr 

Pro Leu Leu Lys Lys Leu Tyr c y3 Gin lie SI J£ J£ ^ J« «6 



100 110 



ctn rTf ?** S T ? TCC ACA CCA CCA CCC CC G GGC ACG GCC ATC CGG GC C 
Gin lie Lys Val Ser Thr Pro Pro Pro Pro Gly Thr ill tie Arg 2a 

120 125 

S SJ SS £ £ S Sj S 55 S £ S SII £ SI 

= T s s 2; a; s s s s s s si ™ as s « «. 



155 



S SI J£ SE « S SI S 31 m J2S £S 2S s as 

170 175 



504 



552 



648 



840 



888 



S5 SI 2S S E S SJ s s S i2 ?H S2 5S K Si 696 

185 19Q 

s ss as s sj s si s: s s s s £ s s s - 

200 205 

S SS S JS ~ -3 « « S js - » « s « ?s 792 

s s s 5; ss s si 21 sj as s s E si si s 

S SS SJ SI S j£ S SI SI S5 SI 5 21 Si SI 2» 

250 255 

si s s ;s s? as si as si s s ssssgis »• 

265 27Q 

£ si s s s si s s s? s: s s si s^ s 
si s s s? s e s? «si S s; s 5 ss ss 

295 300 * 

S 1 SS S 5S S? SS S? IT, ^ E SS J5 S 51? 

i s js s; s a si s s s? s ?i? s §k s s 

335 

5ii s is ?» » s? ss as s? s? s a a; j» 5 



984 



1032 



1080 



1128 



1176 
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AGT CAC CTG CAG CCT CCA TCC TAT GGG CCC GTG CTC TCC CCA ATG AAC 122 4 

Ser His Leu Gin Pro Pro Ser Tyr Gly Pro Val Leu Ser Pro Met Asn 
355 360 365 

AAG GTA CAC GGT GGT GTC AAC AAA CTG CCC TCC GTC AAC CAG CTG GTG 1272 
Lys Val His Gly Gly Val Asn Lys Leu Pro Ser Val Asn Gin Leu Val 
370 375 380 

GGC CAG CCT CCC CCG CAC AGC TCA GCA GCT GGG CCC AAC CTG GGG CCC 1320 
Gly Gin Pro Pro Pro His Ser Ser Ala Ala Gly Pro Asn Leu Gly Pro 
385 390 395 

ATG GGC TCC GGG ATG CTC AAC AGC CAC GGC CAC AGC ATG CCG GCC AAT 13 68 

Met Gly Ser Gly Met Leu Asn Ser His Gly His Ser Met Pro Ala Asn 
400 405 410 415 

GGT GAG ATG AAT GGA GGC CAC AGC TCC CAG ACC ATG GTT TCG GGA TCC 1416 
Gly Glu Met Asn Gly Gly His Ser Ser Gin Thr Met Val Ser Gly Ser 
420 425 430 

CAC TGC ACC CCG CCA CCC CCC TAT CAT GCA GAC CCC AGC CTC GTC AGT 14 64 

His Cys Thr Pro Pro Pro Pro Tyr His Ala Asp Pro Ser Leu Val Ser 
435 440 445 

TTT TTG ACA GGG TTG GGG TGT CCA AAC TGC ATC GAG TGC TTC ACT TCC 1512 
Phe Leu Thr Gly Leu Gly Cys Pro Asn Cys He Glu Cys Phe Thr Ser 
450 455 460 

CAA GGG TTG CAG AGC ATC TAC CAC CTG CAG AAC CTT ACC ATC GAG GAC 15 60 

Gin Gly Leu Gin Ser He Tyr His Leu Gin Asn Leu Thr He Glu Asp 
465 470 475 

CTT GGG GCT CTG AAG GTC CCT GAC CAG TAC CGT ATG ACC ATC TGG AGG 1608 
Leu Gly Ala Leu Lys Val Pro Asp Gin Tyr Arg Met Thr He Trp Arg 
480 485 490 495 

GGC CTA CAG GAC CTG AAG CAG AGC CAT GAC TGC GGC CAG CAA CTG CTA 165 6 

Gly Leu Gin Asp Leu Lys Gin Ser His Asp Cys Gly Gin Gin Leu Leu 
500 505 510 

CGC TCC AGC AGC AAC GCG GCC ACC ATC TCC ATC GGC GGC TCT GGC GAG 170 4 

Arg Ser Ser Ser Asn Ala Ala Thr He Ser He Gly Gly Ser Gly Glu 
515 520 525 

CTG CAG CGG CAG CGG GTC ATG GAA GCC GTG CAT TTC CGT GTG CGC CAC 1752 
Leu Gin Arg Gin Arg Val Met Glu Ala Val His Phe Arg Val Arg His 
530 535 540 

ACC ATC ACA ATC CCC AAC CGT GGA GGC GCA GGT GCG GTG ACA GGT CCC 
Thr lie Thr He Pro Asn Arg Gly Gly Ala Gly Ala Val Thr Gly Pro 
545 550 555 

GAC GAG TGG GCG GAC TTT GGC TTT GAC CTG CCT GAC TGC AAG TCC CGT 18 48 

Asp Glu Trp Ala Asp Phe Gly Phe Asp Leu Pro Asp Cys Lys Ser Arg 
560 565 570 575 

AAG CAG CCC ATC AAA GAG GAG TTC ACA GAG ACA GAG AGC CAC 
Lys Gin Pro He Lys Glu Glu Phe Thr Glu Thr Glu Ser His 
580 5 8 5 

TGAGGAACGT ACC TTC TTC T CCTGTCCTTC CTCTGTGAGA AACTGCTCTT GGAAGTGGGA 1950 
CCTGTTGGCT GTGCC C AC AG AAACCAGCAA GGACCTTCTG CCGGATGCCA TTCCTGAAGG 2010 
GAAGTCGCTC ATGAACTAAC TCCCTCTTGG 2040 



1800 



1890 



(2) INFORMATION POUR LA SEQ ID NO: 8: 



(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 589 acides amines 
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<B) TYPE: acide amine 

CONFIGURATION: lineaire 
Ui> TYPE DE MOLECULE : proteine 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID HO- 8- 
Me, CyS Met Gly Pe? val Tyr Glu ^ ^ n ^ a ^ 

U 45 
Tyr Ala Gin Pro Ser Ser Thr dh. * 

50 SSr T £f Phe As P Thr Met Ser Pro Ala Pro Val 

"J Pro „, Asn „ A , p ryr ,„ Qly p „ ^ ^ ^ ^ 

- «. a. s„ s.r Thr u , Lys ser Iht itp ^ » 

95 

■Leu Leu Lys Lys Leu Tvr Cvs rin n 

100 Cy3 Gln "? ly* Thr Cys Pro n e Gln 

110 

U. vg .« Ihr ,„ ,„ My ^ uj 

ZU 125 
-~ JJJ Ty, ^ ly , „. ^ M , val Ihr ^ ^ v ^ ^ ^ ^ 

I5 - Hi, „„ L , u gj ^ „ ph . to My ^ ^ ^ 

160 

... Hi, L . u n. v, a G1 u 01y leu ^ G1 „ 

175 

vp ,„ jjj Gly ^ ^ v>i ^ ^ ^ ^ 

190 

Pro Gln Val Gly Thr Glu Phe Thr t, t 

195 U Phe Th * He Leu Tyr Asn Phe Met Cy 3 

^ U0 205 Y 

«- mj s.r c val Gly „ y ^ ^ ^ ^ ^ ^ ^ ^ 

a. ». ^ «. Ihr a „ Gly „ val ffi ™ ^ ^ set ph> 

«« «y «. U. eg Ala ey. ,„ „, ^ ^ ly= Ma ™ 

255 

VP Hi, T „ jg Mu Ma ^ ^ ^ ^ 

270 

-V A,, „. .„ t „ „ ^ ^ ^ ^ ^ ^ ^ ^ 

«• J-} «- A„ w ffi Ly , ^ ^ ^ ^ ^ 

•g ^ „« „. v>1 ^ Gly ^ Glu ^ mu ^ 

v., au « m Slu Leu M . t Glu ^ vai fM oin pro ^ 2 

-P ser Iyt ^ G1 „ G1 „ Gin ^ Mn ^ ^ ^ ^ ~ ^ 



350 



• 
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His Leu Gin Pro Pro Ser Tyr Gly Pro Val Leu Ser Pro Met Asn Lys 
355 360 365 

Val His Gly Gly Val Asn Lys Leu Pro Ser Val Asn Gin Leu Val Gly 
370 375 380 

Gin Pro Pro Pro His Ser Ser Ala Ala Gly Pro Asn Leu Gly Pro Met 
385 390 395 400 

Gly Ser Gly Met Leu Asn Ser His Gly His Ser Met Pro Ala Asn Gly 
405 410 415 

Glu Met Asn Gly Gly His Ser Ser Gin Thr Met Val Ser Gly Ser His 
420 425 430 

Cys Thr Pro Pro Pro Pro Tyr His Ala Asp Pro Ser Leu Val Ser Phe 
435 440 445 

Leu Thr Gly Leu Gly Cys Pro Asn Cys lie Glu Cys Phe Thr Ser Gin 
450 455 460 

Gly Leu Gin Ser lie Tyr His Leu Gin Asn Leu Thr lie Glu Asp Leu 
465 470 475 480 

Gly Ala Leu Lys Val Pro Asp Gin Tyr Arg Met Thr lie Trp Arg Gly 
485 490 495 

Leu Gin Asp Leu Lys Gin Ser His Asp Cys Gly Gin Gin Leu Leu Arg 
500 505 510 

Ser Ser Ser Asn Ala Ala Thr He Ser He Gly Gly Ser Gly Glu Leu 
515 520 525 

Gin Arg Gin Arg Val Met Glu Ala Val His Phe Arg Val Arg His Thr 
530 535 540 

He Thr He Pro Asn Arg Gly Gly Ala Gly Ala Val Thr Gly Pro Asp 
545 550 555 560 

Glu Trp Ala Asp Phe Gly Phe Asp Leu Pro Asp Cys Lys Ser Arg Lys 
565 570 575 

Gin Pro He Lys Glu Glu Phe Thr Glu Thr Glu Ser His 
580 585 

(2) INFORMATION POUR LA SEQ ID NO: 9: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

<A) LONGUEUR: 758 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(vi) ORIGINE: 

(A) ORGANISME: Mus musculus 

(ix) CARACTERISTIQUE ADDITIONELLE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 389.. 757 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 9: 

TGGTCCCGCT TCGAC CAAGA CTCCGGCTAC CAGCTTGCGG GCCCCGCGGA GGAGGAGACC 60 

CCGCTGGGGC TAGCTGGGCG ACGCGCGCCA AGCGGCGGCG GGAAGGAGGC GGGAGGAGC G 120 

GGGCCCGAGA CCCCGACTCG GGCAGAGCCA GCTGGGGAGG CGGGGCGCGC GTGGGAGC C A 18 0 
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GGGGCCCGGG 


TGGCCGGCCC 


TCCTCCGCCA 


CGGCTGAGTG 


CCCGCGCTGC 


CTT 


CCCGCCG 


240 


GTCCGCCAAG 


AAAGGCGCTA 


AGCCTGCGGC 


AGTCCCCTCG 


CCGCCGCCTC 


CCTGCTCCGC 


300 


ACCCTTATAA 


CCCGCCGTCC 


CGCATCCAGG 


C GAGGAGGC A 


ACGCTGCAGC 


CCAGCCCTCG 


360 


CCGACGCCGA 


CGCCCGGCCC 


GGAGCAGA ATG AGC GGC AGC 


GTT 


GGG 


GAG 


ATG 


412 






Met Ser Gly Ser 


Val 


Gly 


Glu 


Met 





460 



508 



GCC CAG ACC TCT TCT TCC TCC TCC TCC ACC TTC GAG CAC CTG TGG AGT 
Ala Gin Thr Ser Ser Ser Ser Ser Ser Thr Phe Glu His Leu Trp Ser 
10 15 20 

TCT CTA GAG CCA GAC AGC ACC TAC TTT GAC CTC CCC CAG CCC AGC CAA 
Ser Leu Glu Pro Asp Ser Thr Tyr Phe Asp Leu Pro Gin Pro Ser Gin 
25 30 35 40 

GGG ACT AGC GAG GCA TCA GGC AGC GAG GAG TCC AAC ATG GAT GTC TTC 55 6 

Gly Thr Ser Glu Ala Ser Gly Ser Glu Glu Ser Asn Met Asp Val Phe 
45 50 55 

CAC CTG CAA GGC ATG GCC CAG TTC AAT TTG CTC AGC AGT GCC ATG GAC 604 
His Leu Gin Gly Met Ala Gin Phe Asn Leu Leu Ser Ser Ala Met Asp 
60 65 70 

CAG ATG GGC AGC CGT GCG GCC CCG GCG AGC CCC TAC ACC CCG GAG CAC 652 
Gin Met Gly Ser Arg Ala Ala Pro Ala Ser Pro Tyr Thr Pro Glu His 
? 5 80 85 

GCC GCC AGC GCG CCC ACC CAC TCG CCC TAC GCG CAG CCC AGC TCC ACC 700 
Ala Ala Ser Ala Pro Thr His Ser Pro Tyr Ala Gin Pro Ser Ser Thr 
90 95 100 

TTC GAC ACC ATG TCT CCG GCG CCT GTC ATC CCT TCC AAT ACC GAC TAC 7 48 

Phe Asp Thr Met Ser Pro Ala Pro Val He Pro Ser Asn Thr Asp Tyr 
105 HO 115 120 

CCC GGC CCC C 

Pro Gly Pro 758 



(2) INFORMATION POUR LA SEQ ID NO: 10: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 123 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 10: 

Met Ser Gly Ser Val Gly Glu Met Ala Gin Thr Ser Ser Ser Ser Ser 
1 5 10 15 

Ser Thr Phe Glu His Leu Trp Ser Ser Leu Glu Pro Asp Ser Thr Tvr 
20 25 30 

Phe Asp Leu Pro Gin Pro Ser Gin Gly Thr Ser Glu Ala Ser Gly Ser 
35 40 45 

Glu Glu Ser Asn Met Asp Val Phe His Leu Gin Gly Met Ala Gin Phe 
b0 55 60 

Asn Leu Leu Ser Ser Ala Met Asp Gin Met Gly Ser Arg Ala Ala Pro 
b * 70 75 80 

Ala Ser Pro Tyr Thr Pro Glu His Ala Ala Ser Ala Pro Thr His Ser 
85 90 95 
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Pro Tyr Ala Gin Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala Pro 
100 105 no 

val lie Pro Ser Asn Thr Asp Tyr Pro Gly Pro 
115 120 

(2) INFORMATION POUR LA SEQ ID NO: 11: 

(i) CARACTERI ST I QUES DE LA SEQUENCE: 

(A) LONGUEUR: 559 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(vi) ORIGINE: 

(A) ORGAN I SME : Homo sapiens 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 11: 

CGACCTTCCC CAGTCAAGCC GGGGGAATAA TGAGGTGGTG GGCGGAACGG ATTCCAGCAT 60 

GGACGTCTTC C AC C TGGAGG GCATGACTAC ATCTGTCATG CATCCTCGGC TCCTGCCTCA 12 0 

CTAGCTGCGG AGCCTCTCCC GCTCGGTCCA CGCTGCCGGG CGGCCACGAC CGTGACCCTT 180 

CCCCTCGGGC CGCCCAGATC CATGCCTCGT CCCACGGGAC ACCAGTTCCC TGGCGTGTGC 24 0 

AGACCCCCCG GCGCCTACCA TGCTGTACGT CGGTGACCCC GCACGGCACC TCGCCACGGC 300 

CCAGTTCAAT CTGCTGAGCA GCAC CATGGA CCAGATGAGC AGCCGCGCGG CCTCGGCCAG 360 

CCCCTACACC CCAGAGCACG CCGCCAGCGT GCCCACCCAC TCGCCCTACG CACAACCCAG 420 

CTCCACCTTC GACACCATGT CGCCGGCGCC TGTCATCCCC TCCAACACCG ACTACCCCGG 480 

ACCCCACCAC TTTGAGGTCA CTTTCCAGCA GTCCAGCACG GC C AAGTCAG CCACCTGGAC 540 

GTACTCCCCG CTCTTGAAG 559 
(2) INFORMATION POUR LA SEQ ID NO: 12: 

(i) CARACTERI ST IQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1764 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(vi) ORIGINE: 

(A) ORGANISME: Homo sapiens 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 12: 

ATGCTGTACG TCGGTGACCC CGCACGGCAC CTCGCCACGG CCCAGTTCAA TCTGCTGAGC 60 

AGCACCATGG ACCAGATGAG CAGCCGCGCG GCCTCGGCCA GCCCCTACAC CCCAGAGCAC 120 

GCCGCCAGCG TGCCCACCCA CTCGCCCTAC GCACAACCCA GCTCCACCTT CGACACCATG 180 

TCGCCGGCGC CTGTCATCCC CTCCAACACC GACTACCCCG GACCCCACCA CTTTGAGGTC 240 

ACTTTCCAGC AGTCCAGCAC GGCCAAGTCA GCCACCTGGA CGTACTCCCC GCTCTTGAAG 300 

AAACTCTACT GCCAGATC GC CAAGACATGC CCCATCCAGA TCAAGGTGTC CACCCCGCCA 360 

CCCCCAGGCA CTGCCATCCG GGCCATGCCT GTTTACAAGA AAGC GGAGC A CGTGACCGAC 4 20 
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GTCGTGAAAC 


GCTGCCCCAA 


CCACGAGCTC 


QGGAGGG AC T 


TCAACGAAGG 


ACAGTCTGCT 


430 


CCAGCCAGCC 


ACCTCATCCG 


CGTGGAAGGC 


AATAATCTCT 


CGCAGTATGT 


GGATGACCCT 


540 


GTCACCGGCA 


GGCAGAGCGT 


CGTGGTGCCC 


TATGAGCCAC 


CACAGGTGGG 


GACGGAATTC 


600 


ACCACCATCC 


TGTACAACTT 


CATGTGTAAC 


AGCAGCTGTG 


TAGGGGGCAT 


GAAC C GGC GG 


660 


CCCATCCTCA 


T CAT CATC AC 


CCTGGAGATG 


CGGGATGGGC 


AGGTGCTGGG 


CCGCCGGTCC 


7 ?Ci 


TTTGAGGGCC 


GCATCTGCGC 


CTGTCCTGGC 


CGCGACCGAA 


AAGCTGATGA 


GGACCACTAC 


780 


CGGGAGCAGC 


AGGCCCTGAA 


CGAGAGCTCC 


GCCAAGAACG 


GGGCCGCCAG 


CAAGCGTGCC 


8 40 


TTCAAGCAGA 


GCCCCCCTGC 


CGTCCCCGCC 


CTTGGTGCCG 


GTGTGAAGAA 


GC GGC GGC AT 


900 


GGAGACGAGG 


AC AC GT AC T A 


CCTTCAGGTG 


CGAGGCCGGG 


AGAACTTTGA 


GATCCTGATG 


960 


AAGCTGAAAG 


AGAGCCTGGA 


GCTGATGGAG 


TTGGTGCCGC 


AGCCACTGGT 


GGACTCCTAT 


1020 


CGGCAGCAGC 


AGCAGCTCCT 


ACAGAGGCCG 


AGTCACCTAC 


AGCCCCCGTC 


CTACGGGCCG 


1080 


GTCCTCTCGC 


CCATGAACAA 


GGTGC AC GGG 


GGC AT GAAC A 


AGCTGCCCTC 


CGTCAACCAG 


± -l *a \j 


CTGGTGGGCC 


AGCCTCCCCC 


GCACAGTTCG 


GC AGC T AC AC 


CCAACCTGGG 


GCCCGTGGGC 


12 00 


CCCGGGATGC 


TCAACAACCA 


TGGCCACGCA 


GTGCCAGCCA 


AC GGC GAGAT 


GAGCAGCAGC 


12 60 


CACAGCGCCC 


AGTCCATGGT 


CTCGGGGTCC 


CACTGCACTC 


CGCCACCCCC 


CTACCACGCC 


1320 


GACCCCAGCC 


TCGTCAGTTT 


TTTAACAGGA 


TTGGGGTGTC 


CAAACTGCAT 


C GAGTATTT C 


138 0 


ACCTCCCAAG 


GGTTACAGAG 


CATTTACCAC 


CTGCAGAACC 


TGAC CATTGA 


GGAC C TGGGG 


A.HH\J 


GCCCTGAAGA 


TCCCCGAGCA 


GTACCGCATG 


ACCATCTGGC 


GGGGCCTGCA 


GGAC C T GAAa 


lOUU 


CAGGGCCACG 


ACTACAGCAC 


CGCGCAGCAG 


CTGCTCCGCT 




^At LAIC 


15 60 


TCCATCGGCG 


GCTCAGGGGA 


AC TGCAGC GC 


CAGCGGGTCA 


TGGAGGCCGT 


GCACTTCCGC 


1620 


GTGCGCCACA 


CCATCACCAT 


CCCCAACCGC 


GGCGGCCCAG 


GCGGCGGCCC 


TGACGAGTGG 


1680 


GCGGACTTCG 


GCTTCGACCT 


GCCCGACTGC 


AAGGCCCGCA 


AGCAGCCCAT 


CAAGGAGGAG 


1740 


TTCACGGAGG 


CCGAGATCCA 


CTGA 








1764 


(2) INFORMATION POUR LA SEQ ID NO 


: 13: 









(i) CARACTERI ST I QUES DE LA SEQUENCE: 

(A) LONGUEUR: 587 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 13: 

Met Leu Tyr Val Gly Asp Pro Ala Arg His Leu Ala Thr Ala Gin Phe 
1 5 10 15 

Asn Leu Leu Ser Ser Thr Met Asp Gin Met Ser Ser Arg Ala Ala Ser 
20 25 30 

Ala Ser Pro Tyr Thr Pro Glu His Ala Ala Ser Val Pro Thr His Ser 
35 40 45 

Pro Tyr Ala Gin Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala Pro 
50 55 60 
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Val lie Pro Ser Asn Thr Asp Tyr Pro Gly Pro His His Phe Glu Vai 
65 .70 75 80 

Thr Phe Gin Gin Ser Ser Thr Ala Lys Ser Ala Thr Trp Thr Tyr Ser 
85 90 95 

Pro Leu Leu Lys Lys Leu Tyr Cys Gin lie Ala Lys Thr Cys Pro lie 
100 105 no 

Gin lie Lys Val Ser Thr Pro Pro Pro Pro Gly Thr Ala lie Arg Ala 
115 120 125 

Met Pro Val Tyr Lys Lys Ala Glu His Val Thr Asp Val Val Lys Arq 
130 135 140 

Cys Pro Asn His Glu Leu Gly Arg Asp Phe Asn Glu Gly Gin Ser Ala 
145 150 155 160 

Pro Ala Ser His Leu He Arg Val Glu Gly Asn Asn Leu Ser Gin Tyr 
165 170 175 

Val Asp Asp Pro Val Thr Gly Arg Gin Ser Val Val Val Pro Tyr Glu 
180 185 190 

Pro Pro Gin Val Gly Thr Glu Phe Thr Thr He Leu Tyr Asn Phe Met 
195 200 205 

Cys Asn Ser Ser Cys Val Gly Gly Met Asn Arg Arg Pro He Leu He 
210 215 220 

He He Thr Leu Glu Met Arg Asp Gly Gin Val Leu Gly Arg Arg Ser 
225 230 235 240 

Phe Glu Gly Arg He Cys Ala Cys Pro Gly Arg Asp Arg Lys Ala Asp 
245 250 255 

Glu Asp His Tyr Arg Glu Gin Gin Ala Leu Asn Glu Ser Ser Ala Lys 
260 265 270 

Asn Gly Ala Ala Ser Lys Arg Ala Phe Lys Gin Ser Pro Pro Ala Val 
275 280 285 

Pro Ala Leu Gly Ala Gly Val Lys Lys Arg Arg His Gly Asp Glu Asp 
290 295 300 

Thr Tyr Tyr Leu Gin Val Arg Gly Arg Glu Asn Phe Glu He Leu Met 
305 310 315 320 

Lys Leu Lys Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gin Pro Leu 
325 330 335 

Val Asp Ser Tyr Arg Gin Gin Gin Gin Leu Leu Gin Arg Pro Ser His 
340 345 350 

Leu Gin Pro Pro Ser Tyr Gly Pro Val Leu Ser Pro Met Asn Lys Val 
355 360 365 

His Gly Gly Met Asn Lys Leu Pro Ser Val Asn Gin Leu Val Gly Gin 
370 375 380 

Pro Pro Pro His Ser Ser Ala Ala Thr Pro Asn Leu Gly Pro Val Gly 
385 390 395 400 

Pro Gly Met Leu Asn Asn His Gly His Ala Val Pro Ala Asn Gly Glu 
405 410 4i5 

Met Ser Ser Ser His Ser Ala Gin- Ser Met Val Ser Gly Ser His Cvs 
420 425 430 

Thr Pro Pro Pro Pro Tyr His Ala Asp Pro Ser Leu Val Ser Phe Leu 
435 440 445 
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Thr Gly Leu Gly Cys Pro Asn Cys lie Glu Tyr Phe Thr Ser Gin Glv 
450 455 - 460 

Leu Gin Ser lie Tyr His Leu Gin Asn Leu Thr He Glu Asp Leu Glv 
465 470 475 4 8 o 

Ala Leu Lys He Pro Glu Gin Tyr Arg Met Thr He Trp Arg Gly Leu 
485 490 495 

Gin Asp Leu Lys Gin Gly His Asp Tyr Ser Thr Ala Gin Gin Leu Leu 
500 505 510 

Arg Ser Ser Asn Ala Ala Thr He Ser He Gly Gly Ser Gly Glu Leu 
515 520 525 

Gin Arg Gin Arg Val Met Glu Ala Val His Phe Arg Val Arg His Thr 
530 535 54 0 

He Thr He Pro Asn Arg Gly Gly Pro Gly Gly Gly Pro Asp Glu Tro 
545 550 555 560 

Ala Asp Phe Gly Phe Asp Leu Pro Asp Cys Lys Ala Arg Lys Gin Pro 
565 570 575 

He Lys Glu Glu Phe Thr Glu Ala Glu He His 
580 585 

(2) INFORMATION POUR LA SEQ ID NO: 14: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1521 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(vi) ORIGINE: 

(A) ORGANISME: Homo sapiens 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 14: 



ATGCTGTACG 


TCGGTGACCC 


CGCACGGCAC 


CTCGCCACGG CCCAGTTCAA 


TCTGCTGAGC 


60 


AGCACCATGG 


AC CAGATGAG 


CAGCCGCGCG 


GCCTCGGCCA GCCCCTACAC 


CCCAGAGCAC 


120 


GCCGCCAGCG 


TGCCCACCCA CTCGCCCTAC 


GCACAACCCA GCTCCACCTT 


CGACACCATG 


180 


TCGCCGGCGC 


CTGTCATCCC 


CTCCAACACC 


GACTACCCCG GACCCCACCA 


CTTTGAGGTC 


240 


ACTTTCCAGC 


AGTC CAGCAC 


GGCCAAGTCA 


GCCACCTGGA CGTACTCCCC 


GCTCTTGAAG 


300 


AAACTCTACT 


GCCAGATCGC 


CAAGACATGC 


CCCATCCAGA TCAAGGTGTC 


CACCCCGCCA 


360 


CCCCCAGGCA 


CTGCCATCCG 


GGCCATGCCT 


GTTTACAAGA AAGCGGAGCA CGTGACCGAC 


420 


GTCGTGAAAC 


GCTGCCCCAA 


CCACGAGCTC 


GGGAGGGACT TCAACGAAGG ACAGTCTGCT 


480 


CCAGCCAGCC 


ACCTCATCCG 


CGTGGAAGGC 


AATAATCTCT CGCAGTATGT 


GGATGACCCT 


540 


GTCACCGGCA 


GGCAGAGCGT 


CGTGGTGCCC 


TATGAGC CAC CACAGGTGGG 


GAC GGAATTC 


600 


ACCACCATCC 


TGTACAACTT 


CATGTGTAAC 


AGCAGCTGTG TAGGGGGCAT 


GAACCGGCGG 


660 


CCCATCCTCA 


TCAT CATC AC 


CCTGGAGATG 


CGGGATGGGC AGGTGCTGGG 


CCGCCGGTCC 


720 


TTTGAGGGCC 


GCATCTGCGC 


CTGTCCTGGC 


CGCGACCGAA AAGCTGATGA 


GGACCACTAC 


780 


CGGGAGCAGC 


AGGCC CTGAA 


CGAGAGCTCC 


GCCAAGAACG GGGC CGCCAG 


CAAGCGTGCC 


840 


TTCAAGCAGA 


GCCCCCCTGC 


CGTCCCCGCC 


CTTGGTGCCG GTGTGAAGAA 


GCGGCGGCAT 


900 
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GGAGACGAGG AC AC GT AC T A CCTTCAGGTG CGAGGCCGGG AGAACTTTGA GATCCTGATG 
AAGC TGAAAG AGAGCCTGGA GCTGATGGAG TTGGTGCCGC AGCCACTGGT GGACTCCTAT 
CGGCAGCAGC AGCAGCTCCT AC AGAGGC C G CCCCGGGATG CTCAACAACC ATGGCCACGC 
AGTGCCAGCC AACGGCGAGA TGAGCAGCAG CCACAGCGCC CAGTCCATGG TCTCGGGGTC 
CCACTGCACT CCGCCACCCC CCTACCACGC CGACCCCAGC CTCGTCAGGA CCTGGGGGCC 
CTGAAGATCC CCGAGCAGTA CCGCATGACC ATCTGGCGGG GCCTGCAGGA C C T GAAGC AG 
GGCCACGACT ACAGCACCGC GCAGCAGCTG CTCCGCTCTA GCAACGCGGC CACCATCTCC 
ATCGGCGGCT CAGGGGAACT GCAGCGCCAG CGGGTCATGG AGGCCGTGCA CTTCCGCGTG 
CGCCACACCA TCACCATCCC CAACCGCGGC GGCCCAGGCG GCGGCCCTGA CGAGTGGGCG 
GACTTCGGCT TCGACCTGCC CGACTGCAAG GCCCGCAAGC AGCCCATCAA GGAGGAGTTC 
AC GGAGGCC G AGATCCACTG A 

(2) INFORMATION POUR LA SEQ ID NO: 15: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 506 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 15: 

Met Leu Tyr Val Gly Asp Pro Ala Arg His Leu Ala Thr Ala Gin Phe 
15 10 15 

Asn Leu Leu Ser Ser Thr Met Asp Gin Met Ser Ser Arg Ala Ala Ser 
20 25 30 

Ala Ser Pro Tyr Thr Pro Glu His Ala Ala Ser Val Pro Thr His Ser 
35 40 45 

Pro Tyr Ala Gin Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala Pro 
50 55 60 

Val lie Pro Ser Asn Thr Asp Tyr Pro Gly Pro His His Phe Glu Val 
65 70 75 80 

Thr Phe Gin Gin Ser Ser Thr Ala Lys Ser Ala Thr Trp Thr Tyr Ser 
85 90 95 

Pro Leu Leu Lys Lys Leu Tyr Cys Gin lie Ala Lys Thr Cys Pro lie 
100 105 no 

Gin He Lys Val Ser Thr Pro Pro Pro Pro Gly Thr Ala He Arg Ala 
115 120 125 

Met Pro Val Tyr Lys Lys Ala Glu His Val Thr Asp Val Val Lys Ara 
130 135 140 

Cys Pro Asn His Glu Leu Gly Arg Asp Phe Asn Glu Gly Gin Ser Ala 
145 150 155 160 

Pro Ala Ser His Leu He Arg Val Glu Gly Asn Asn Leu Ser Gin Tyr 
165 ivo 175 

Val Asp Asp Pro Val Thr Gly Arg Gin Ser Val Val Val Pro Tyr Glu 



960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1521 
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Pro Pro Gin Val Gly Thr Glu Phe Thr Thr lie Leu Tyr Asn Phe Met 
195 200 205 

Cys Asn Ser Ser Cys Val Gly Gly Met Asn Arg Arg Pro lie Leu He 
210 215 220 

He He Thr Leu Glu Met Arg Asp Gly Gin Val Leu Gly Arg Arg Ser 
225 230 235 240 

Phe Glu Gly Arg He Cys Ala Cys Pro Gly Arg Asp Arg Lys Ala Asp 
245 250 255 

Glu Asp His Tyr Arg Glu Gin Gin Ala Leu Asn Glu Ser Ser Ala Lys 
260 265 270 

Asn Gly Ala Ala Ser Lys Arg Ala Phe Lys Gin Ser Pro Pro Ala Val 
275 280 285 

Pro Ala Leu Gly Ala Gly Val Lys Lys Arg Arg His Gly Asp Glu Asp 
290 295 300 

Thr Tyr Tyr Leu Gin Val Arg Gly Arg Glu Asn Phe Glu He Leu Met 
305 310 315 320 

Lys Leu Lys Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gin Pro Leu 
325 330 335 

Val Asp Ser Tyr Arg Gin Gin Gin Gin Leu Leu Gin Arg Pro Pro Arg 
340 345 350 

Asp Ala Gin Gin Pro Trp Pro Arg Ser Ala Ser Gin Arg Arg Asp Glu 
355 360 365 

Gin Gin Pro Gin Arg Pro Val His Gly Leu Gly Val Pro Leu His Ser 
370 375 380 

Ala Thr Pro Leu Pro Arg Arg Pro Gin Pro Arg Gin Asp Leu Gly Ala 
385 390 395 400 

Leu Lys He Pro Glu Gin Tyr Arg Met Thr He Trp Arg Gly Leu Gin 
405 410 415 

Asp Leu Lys Gin Gly His Asp Tyr Ser Thr Ala Gin Gin Leu Leu Arg 
420 425 430 

Ser Ser Asn Ala Ala Thr He Ser He Gly Gly Ser Gly Glu Leu Gin 
435 440 445 

Arg Gin Arg Val Met Glu Ala Val His Phe Arg Val Arg His Thr He 
450 455 460 

Thr He Pro Asn Arg Gly Gly Pro Gly Gly Gly Pro Asp Glu Trp Ala 
465 470 475 48 0 

Asp Phe Gly Phe Asp Leu Pro Asp Cys Lys Ala Arg Lys Gin Pro He 
485 490 495 

Lys Glu Glu Phe Thr Glu Ala Glu He His 
500 505 

(2) INFORMATION POUR LA SEQ ID NO: 16: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1870 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(vi) ORIGINE: 

(A) ORGANISME: Homo sapiens 
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(ix) CARACTERISTIQUE ADDITIONELLE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 104.. 1867 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 16: 

TGCCCGGGGC TGCGACGGCT GCAGGGAACC AGACAGCACC TACTTCGACC TTCCCCAGTC 60 

AAGCCGGGGG AATAATGAGG TGGTGGGCGG AACGGATTCC AGC ATG GAC GTC TTC 115 

Met Asp Val Phe 
1 

CAC CTG GAG GGC ATG ACT ACA TCT GTC ATG GCC CAG TTC AAT CTG CTG 163 
His Leu Glu Gly Met Thr Thr Ser Val Met Ala Gin Phe Asn Leu Leu 
5 10 15 20 

AGC AGC ACC ATG GAC CAG ATG AGC AGC CGC GCG GCC TCG GCC AGC CCC 211 
Ser Ser Thr Met Asp Gin Met Ser Ser Arg Ala Ala Ser Ala Ser Pro 
25 30 35 

TAC ACC CCA GAG CAC GCC GCC AGC GTG CCC ACC CAC TCG CCC TAC GCA 259 
Tyr Thr Pro Glu His Ala Ala Ser Val Pro Thr His Ser Pro Tyr Ala 
40 45 50 

CAA CCC AGC TCC ACC TTC GAC ACC ATG TCG CCG GCG CCT GTC ATC CCC 307 
Gin Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala Pro Val lie Pro 
55 60 65 

TCC AAC ACC GAC TAC CCC GGA CCC CAC CAC TTT GAG GTC ACT TTC CAG 355 
Ser Asn Thr Asp Tyr Pro Gly Pro His His Phe Glu Val Thr Phe Gin 
70 75 80 

CAG TCC AGC ACG GCC AAG TCA GCC ACC TGG ACG TAC TCC CCG CTC TTG 4 03 

Gin Ser Ser Thr Ala Lys Ser Ala Thr Trp Thr Tyr Ser Pro Leu Leu 
85 90 95 100 

AAG AAA CTC TAC TGC CAG ATC GCC AAG ACA TGC CCC ATC CAG ATC AAG 451 
Lys Lys Leu Tyr Cys Gin lie Ala Lys Thr Cys Pro lie Gin He Lys 
105 no us 

GTG TCC ACC CCG CCA CCC CCA GGC ACT GCC ATC CGG GCC ATG CCT GTT 499 
Val Ser Thr Pro Pro Pro Pro Gly Thr Ala He Arg Ala Met Pro Val 
120 125 130 

TAC AAG AAA GCG GAG CAC GTG ACC GAC GTC GTG AAA CGC TGC CCC AAC 547 
Tyr Lys Lys Ala Glu His Val Thr Asp Val Val Lys Arg Cys Pro Asn 
135 140 145 

CAC GAG CTC GGG AGG GAC TTC AAC GAA GGA CAG TCT GCT CCA GCC AGC 595 
His Glu Leu Gly Arg Asp Phe Asn Glu Gly Gin Ser Ala Pro Ala Ser 
150 155 160 

CAC CTC ATC CGC GTG GAA GGC AAT AAT CTC TCG CAG TAT GTG GAT GAC 643 
His Leu He Arg Val Glu Gly Asn Asn Leu Ser Gin Tyr Val Asp Asp 
165 170 175 * 180 

CCT GTC ACC GGC AGG CAG AGC GTC GTG GTG CCC TAT GAG CCA CCA CAG 691 
Pro Val Thr Gly Arg Gin Ser Val Val Val Pro Tyr Glu Pro Pro Gin 
185 190 195 

GTG GGG ACG GAA TTC ACC ACC ATC CTG TAC AAC TTC ATG TGT AAC AGC 739 
Val Gly Thr Glu Phe Thr Thr lie Leu Tyr Asn Phe Met Cys Asn Ser 
200 205 210 

AGC TGT GTA GGG GGC ATG AAC CGG CGG CCC ATC CTC ATC ATC ATC ACC 
Ser Cys Val Gly Gly Met Asn Arg Arg Pro He Leu He He He Thr 
215 220 225 

t1° ^ G « TG CGG GAT 000 CAG GTG CTG GGC C GC CGG TCC TTT GAG GGC 835 
Leu Glu Met Arg Asp Gly Gin Val Leu Gly Arg Arg Ser Phe Glu Gly 
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230 235 240 

CGC ATC TGC GCC TGT CCT GGC CGC GAC CGA AAA GCT GAT GAG GAC CAC 883 
Arg lie Cys Ala Cys Pro Gly Arg Asp Arg Lys Ala Asp Glu Asp His 
245 250 255 260 

TAC CGG GAG CAG CAG GCC CTG AAC GAG AGC TCC GCC AAG AAC GGG GCC 931 
Tyr Arg Glu Gin Gin Ala Leu Asn Glu Ser Ser Ala Lys Asn Gly Ala 
265 270 275 

GCC AGC AAG CGT GCC TTC AAG CAG AGC CCC CCT GCC GTC CCC GCC CTT 979 
Ala Ser Lys Arg Ala Phe Lys Gin Ser Pro Pro Ala Val Pro Ala Leu 
280 285 290 

GGT GCC GGT GTG AAG AAG CGG CGG CAT GGA GAC GAG GAC ACG TAC TAC 102 7 

Gly Ala Gly Val Lys Lys Arg Arg His Gly Asp Glu Asp Thr Tyr Tyr 
295 300 305 

CTT CAG GTG CGA GGC CGG GAG AAC TTT GAG ATC CTG ATG AAG CTG AAA 1075 
Leu Gin Val Arg Gly Arg Glu Asn Phe Glu lie Leu Met Lys Leu Lys 
310 315 320 

GAG AGC CTG GAG CTG ATG GAG TTG GTG CCG CAG CCA CTG GTG GAC TCC 112 3 

Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gin Pro Leu Val Asp Ser 
325 330 335 340 

TAT CGG CAG CAG CAG CAG CTC CTA CAG AGG CCG AGT CAC CTA CAG CCC 1171 
Tyr Arg Gin Gin Gin Gin Leu Leu Gin Arg Pro Ser His Leu Gin Pro 
345 350 355 

CCG TCC TAC GGG CCG GTC CTC TCG CCC ATG AAC AAG GTG CAC GGG GGC 1219 
Pro Ser Tyr Gly Pro Val Leu Ser Pro Met Asn Lys Val His Gly Gly 
360 365 370 

ATG AAC AAG CTG CCC TCC GTC AAC CAG CTG GTG GGC CAG CCT CCC CCG 1267 
Met Asn Lys Leu Pro Ser Val Asn Gin Leu Val Gly Gin Pro Pro Pro 
375 380 385 

CAC AGT TCG GCA GCT ACA CCC AAC CTG GGG CCC GTG GGC CCC GGG ATG 1315 
His Ser Ser Ala Ala Thr Pro Asn Leu Gly Pro Val Gly Pro Gly Met 
390 395 400 

CTC AAC AAC CAT GGC CAC GCA GTG CCA GCC AAC GGC GAG ATG AGC AGC 1363 
Leu Asn Asn His Gly His Ala Val Pro Ala Asn Gly Glu Met Ser Ser 
405 410 415 420 

AGC CAC AGC GCC CAG TCC ATG GTC TCG GGG TCC CAC TGC ACT CCG CCA 1411 
Ser His Ser Ala Gin Ser Met Val Ser Gly Ser His Cys Thr Pro Pro 
425 430 435 

CCC CCC TAC CAC GCC GAC CCC AGC CTC GTC AGT TTT TTA ACA GGA TTG 14 59 

Pro Pro Tyr His Ala Asp Pro Ser Leu Val Ser Phe Leu Thr Gly Leu 
440 445 4S0 

GGG TGT CCA AAC TGC ATC GAG TAT TTC ACC TCC CAA GGG TTA CAG AGC 1507 
Gly Cys Pro Asn Cys He Glu Tyr Phe Thr Ser Gin Gly Leu Gin Ser 
455 460 465 

ATT TAC CAC CTG CAG AAC CTG ACC ATT GAG GAC CTG GGG GCC CTG AAG 1555 
He Tyr His Leu Gin Asn Leu Thr He Glu Asp Leu Gly Ala Leu Lvs 
470 475 480 

ATC CCC GAG CAG TAC CGC ATG ACC ATC TGG CGG GGC CTG CAG GAC CTG 1603 
lie Pro Glu Gin Tyr Arg Met Thr He Trp Arg Gly Leu Gin Asp Leu 
485 490 495 500 

AAG CAG GGC CAC GAC TAC AGC ACC GCG CAG CAG CTG CTC CGC TCT AGC 1651 
Lys Gin Gly His Asp Tyr Ser Thr Ala Gin Gin Leu Leu Arg Ser Ser 
505 510 515 

^ C 5? G ^ C ACC ATC TCC ATC ^ TCA GGG GAA CTG CAG CGC CAG 1699 

Asn Ala Ala Thr He Ser He Gly Gly Ser Gly Glu Leu Gin Arg Gin 
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520 










525 










530 








CGG 
Arg 


GTC 
Val 


ATG 
Met 
535 


GAG 
Glu 


GCC 
Ala 


GTG 
Val 


CAC 
His 


TTC 
Phe 
540 


CGC 
Arg 


GTG 
Val 


CGC 
Arg 


CAC 
His 


ACC 
Thr 
545 


ATC 
lie 


ACC 
Thr 


ATC 
He 


1747 


CCC 
Pro 


AAC 
Asn 

550 


CGC 
Arg 


GGC 
Gly 


GGC 
Gly 


CCA 
Pro 


GGC 
Gly 
555 


GGC 
Gly 

W J. J 


GGC 
Gly 


CCT 
Pro 


GAC 
Asd 


GAG 
Glu 
560 


TGG 
TrD 

■*• tr 


GCG 
Ala 


GAC 
Asp 


TTC 
Phe 


1795 


GGC 
Gly 
565 


TTC 
Phe 


GAC 
Asp 


CTG 
Leu 


CCC 
Pro 


GAC 
Asp 
570 


TGC 
Cys 


AAG 
Lys 


GCC 
Ala 


CGC 
Arg 


AAG 
Lys 
575 


CAG 
Gin 


CCC 
Pro 


ATC 
He 


AAG 
Lys 


GAG 
Glu 
580 


1843 


GAG 
Glu 


TTC 
Phe 


ACG 
Thr 


GAG 
Glu 


GCC 
Ala 


GAG 
Glu 


ATC 
lie 


CAC 
His 


TGA 
















1870 



585 

(2) INFORMATION POUR LA SEQ ID NO: 17: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 588 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 17: 

Met Asp Val Phe His Leu Glu Gly Met Thr Thr Ser Val Met Ala Gin 
1 5 10 15 

Phe Asn Leu Leu Ser Ser Thr Met Asp Gin Met Ser Ser Arg Ala Ala 
20 25 30 

Ser Ala Ser Pro Tyr Thr Pro Glu His Ala Ala Ser Val Pro Thr His 
35 40 45 

Ser Pro Tyr Ala Gin Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala 
50 55 60 

Pro Val He Pro Ser Asn Thr Asp Tyr Pro Gly Pro His His Phe Glu 
65 70 75 80 

Val Thr Phe Gin Gin Ser Ser Thr Ala Lys Ser Ala Thr Trp Thr Tyr 
85 90 95 

Ser Pro Leu Leu Lys Lys Leu Tyr Cys Gin He Ala Lys Thr Cys Pro 
100 105 HO 

He Gin He Lys Val Ser Thr Pro Pro Pro Pro Gly Thr Ala He Arg 
115 120 125 

Ala Met Pro Val Tyr Lys Lys Ala Glu His Val Thr Asp Val Val Lys 
130 135 140 

Arg Cys Pro Asn His Glu Leu Gly Arg Asp Phe Asn Glu Gly Gin Ser 
145 150 155 160 

Ala Pro Ala Ser His Leu He Arg Val Glu Gly Asn Asn Leu Ser Gin 
165 170 175 

Tyr Val Asp Asp Pro Val Thr Gly Arg Gin Ser Val Val Val Pro Tyr 
180 185 190 

Glu Pro Pro Gin Val Gly Thr Glu Phe Thr Thr He Leu Tyr Asn Phe 
X95 200 205 

Met Cys Asn Ser Ser Cys Val Gly Gly Met Asn Arg Arg Pro He Leu 
210 215 220 ' 
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lie lie He Thr Leu Glu Met Arg Asp Gly Gin Val Leu Gly Ara Ara 
225 230 235 2 40 

Ser Phe Glu Gly Arg He Cys Ala Cys Pro Gly Arg Asp Arg Lys Ala 
245 250 255 

Asp Glu Asp His Tyr Arg Glu Gin Gin Ala Leu Asn Glu Ser Ser Ala 
260 265 270 

Lys Asn Gly Ala Ala Ser Lys Arg Ala Phe Lys Gin Ser Pro Pro Ala 
275 280 285 

Val Pro Ala Leu Gly Ala Gly Val Lys Lys Arg Arg His Gly Asp Glu 
290 295 300 

Asp Thr Tyr Tyr Leu Gin Val Arg Gly Arg Glu Asn Phe Glu He Leu 
305 310 315 320 

Met Lys Leu Lys Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gin Pro 
325 330 335 

Leu Val Asp Ser Tyr Arg Gin Gin Gin Gin Leu Leu Gin Arg Pro Ser 
340 345 350 

His Leu Gin Pro Pro Ser Tyr Gly Pro Val Leu Ser Pro Met Asn Lys 
355 360 365 

Val His Gly Gly Met Asn Lys Leu Pro Ser Val Asn Gin Leu Val Glv 
370 375 380 

Gin Pro Pro Pro His Ser Ser Ala Ala Thr Pro Asn Leu Gly Pro Val 
385 390 395 400 

Gly Pro Gly Met Leu Asn Asn His Gly His Ala Val Pro Ala Asn Gly 
405 410 415 

Glu Met Ser Ser Ser His Ser Ala Gin Ser Met Val Ser Gly Ser His 
420 425 430 

Cys Thr Pro Pro Pro Pro Tyr His Ala Asp Pro Ser Leu Val Ser Phe 
435 440 445 

Leu Thr Gly Leu Gly Cys Pro Asn Cys He Glu Tyr Phe Thr Ser Gin 
450 455 460 

Gly Leu Gin Ser He Tyr His Leu Gin Asn Leu Thr He Glu Asp Leu 
465 470 475 ^ 480 

Gly Ala Leu Lys He Pro Glu Gin Tyr Arg Met Thr lie Trp Arg Gly 
485 490 495 

Leu Gin Asp Leu Lys Gin Gly His Asp Tyr Ser Thr Ala Gin Gin Leu 
500 505 510 

Leu Arg Ser Ser Asn Ala Ala Thr He Ser He Gly Gly Ser Gly Glu 
515 520 525 

Leu Gin Arg Gin Arg Val Met Glu Ala Val His Phe Arg Val Arg His 
530 535 540 

Thr He Thr He Pro Asn Arg Gly Gly Pro Gly Gly Gly Pro Asp Glu 
545 550 555 560 

Trp Ala Asp Phe Gly Phe Asp Leu Pro Asp Cys Lys Ala Arg Lys Gin 
565 570 575 

Pro He Lys Glu Glu Phe Thr Glu Ala Glu He His 
580 585 

(2) INFORMATION POUR LA SEQ ID NO: 18: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
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(A) LONGUEUR: 1817 paire,s de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(vi) ORIGINE: 

(A) ORGANISME: Homo sapiens 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 18: 



ATGGCCCAGT 


CCACCGCCAC 


CTCCCCTGAT 


GGGGGC AC C A 


CGTTTGAGCA 


CCTCTGGAGC 


60 


TCTCTGGAAC 


CAGACAGCAC 


CTACTTCGAC 


CTTCCCCAGT 


CAAGCCGGGG 


GAATAATGAG 


120 


GTGGTGGGCG 


GAAC GGATT C 


CAGCATGGAC 


GTCTTCCACC 


T GGAGGGC AT 


GACTACATCT 


180 


GTCATGGCCC 


AGTTCAATCT 


GCTGAGCAGC 


AC CAT GGAC C 


AGATGAGCAG 


CCGCGCGGCC 


240 


TCGGCCAGCC 


CCTACACCCC 


AGAGC AC GC C 


GC CAGCGTGC 


CCACCCACTC 


GCCCTACGCA 


300 


CAACCCAGCT 


CCACCTTCGA 


CACCATGTCG 


CCGGCGCCTG 


TCATCCCCTC 


CAACACCGAC 


360 


TACCCCGGAC 


CCCACCACTT 


TGAGGTCACT 


TTCCAGCAGT 


CCAGCACGGC 


CAAGTCAGCC 


420 


ACCTGGACGT 


ACTCCCCGCT 


CTTGAAGAAA 


CTCTACTGCC 


AGATCGCCAA 


GACATGCCCC 


480 


ATCCAGATCA 


AGGTGTCCAC 


CCCGCCACCC 


CCAGGCACTG 


CCATCCGGGC 


CATGCCTGTT 


S40 


TACAAGAAAG 


CGGAGCACGT 


GACCGACGTC 


GTGAAAC GC T 


GCCCCAACCA 


CGAGCTCGGG 


600 


AGGGACTTCA 


AC GAAGGAC A 


GTCTGCTCCA 


GCCAGCCACC 


TCATCCGCGT 


GGAAGGCAAT 


660 


AATCTCTCGC 


AGTATGTGGA 


TGACCCTGTC 


ACCGGCAGGC 


AGAGC GT C GT 


GGTGCCCTAT 


720 


GAGCCACCAC 


AGGTGGGGAC 


GGAATTCACC 


AC CATCCTGT 


ACAACTTCAT 


GTGTAACAGC 


780 


AGCTGTGTAG 


GGGGCAT GAA 


CCGGCGGCCC 


ATCCTCATCA 


TCATCACCCT 


GGAGATGCGG 


840 


GATGGGCAGG 


TGCTGGGCCG 


CCGGTCCTTT 


GAGGGC C GC A 


TCTGCGCCTG 


TCCTGGCCGC 


900 


GACCGAAAAG 


CTGATGAGGA 


CCACTACCGG 


GAGCAGCAGG 


CCCTGAACGA 


GAGCTCCGCC 


960 


AAGAACGGGG 


CCGCCAGCAA 


GCGTGCCTTC 


AAGC AGAGC C 


CCCCTGCCGT 


CCCCGCCCTT 


1020 


GGTGCCGGTG 


TGAAGAAGCG 


GC GGC AT GGA 


GACGAGGACA 


CGTACTACCT 


TCAGGTGCGA 


1080 


GGCCGGGAGA 


ACTTTGAGAT 


CCTGATGAAG 


CTGAAAGAGA 


GCCTGGAGCT 


GATGGAGTTG 


1140 


GTGCCGCAGC 


CACTGGT GGA 


CTCCTATCGG 


CAGCAGCAGC 


AGCTCCTACA 


GAGGCCGAGT 


1200 


CACCTACAGC 


CCCCGTCCTA 


CGGGCCGGTC 


CTCTCGCCCA 


TGAACAAGGT 


GC AC GGGGGC 


1260 


AT GAAC AAGC 


TGCCCTCCGT 


CAACCAGCTG 


GTGGGCCAGC 


CTCCCCCGCA 


CAGTTCGGCA 


1320 


GCTACACCCA ACCTGGGGCC 


CGTGGGCCCC 


GGGATGCTCA 


ACAACCATGG 


CCACGCAGTG 


1380 


CCAGCCAACG 


GCGAGATGAG 


CAGCAGCCAC 


AGCGCCCAGT 


CCATGGTCTC 


GGGGTCCCAC 


1440 


TGCACTCCGC 


CACCCCCCTA 


CCACGCCGAC 


CCCAGCCTCG 


TCAGGACCTG 


GGGGCCCTGA 


1500 


AGATCCCCGA 


GCAGTACCGC 


ATGACCATCT 


GGCGGGGCCT 


GCAGGACCTG 


AAGCAGGGCC 


1560 


ACGACTACAG 


CACCGCGCAG 


CAGCTGCTCC 


GCTCTAGCAA 


CGCGGCCACC 


ATCTCCATCG 


1620 


GCGGCTCAGG 


GGAACTGCAG 


CGCCAGCGGG 


TCATGGAGGC 


CGTGCACTTC 


CGCGTGCGCC 


1680 


ACACCATCAC 


CATCCCCAAC 


CGCGGCGGCC 


CAGGCGGCGG 


C C CTGAC GAG 


TGGGCGGACT 


1740 


TCGGCTTCGA 


CCTGCCCGAC 


TGCAAGGCCC 


GCAAGCAGCC 


CATCAAGGAG 


GAGTTCACGG 


1800 
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AGGCCGAGAT CCACTGA 

(2) INFORMATION POUR LA SEQ ID NO: 19: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 4 99 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 19: 

Met Ala Gin Ser Thr Ala Thr Ser Pro Asp Gly Gly Thr Thr Phe Glu 
1 5 10 15 

His Leu Trp Ser Ser Leu Glu Pro Asp Ser Thr Tyr Phe Asp Leu Pro 
20 25 30 

Gin Ser Ser Arg Gly Asn Asn Glu Val Val Gly Gly Thr Asp Ser Ser 
35 40 45 

Met Asp Val Phe His Leu Glu Gly Met Thr Thr Ser Val Met Ala Gin 
50 55 60 

Phe Asn Leu Leu Ser Ser Thr Met Asp Gin Met Ser Ser Arg Ala Ala 
65 70 75 80 

Ser Ala Ser Pro Tyr Thr Pro Glu His Ala Ala Ser Val Pro Thr His 
85 90 95 

Ser Pro Tyr Ala Gin Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala 
100 105 no 

Pro Val lie Pro Ser Asn Thr Asp Tyr Pro Gly Pro His His Phe Glu 
115 120 125 

Val Thr Phe Gin Gin Ser Ser Thr Ala Lys Ser Ala Thr Trp Thr Tvr 
130 135 140 

Ser Pro Leu Leu Lys Lys Leu Tyr Cys Gin lie Ala Lys Thr Cys Pro 
145 150 155 160 

He Gin He Lys Val Ser Thr Pro Pro Pro Pro Gly Thr Ala He Arg 
165 170 175 

Ala Met Pro Val Tyr Lys Lys Ala Glu His Val Thr Asp Val Val Lys 
180 185 190 

Arg Cys Pro Asn His Glu Leu Gly Arg Asp Phe Asn Glu Gly Gin Ser 
195 200 205 

Ala Pro Ala Ser His Leu He Arg Val Glu Gly Asn Asn Leu Ser Gin 
210 215 220 

Tyr Val Asp Asp Pro Val Thr Gly Arg Gin Ser Val Val Val Pro Tvr 
225 230 235 240 

Glu Pro Pro Gin Val Gly Thr Glu Phe Thr Thr He Leu Tyr Asn Phe 
245 250 255 

Met Cys Asn Ser Ser Cys Val Gly Gly Met Asn Arg Arg Pro He Leu 
260 265 270 

He lie lie Thr Leu Glu Met Arg Asp Gly Gin Val Leu Gly Arg Arg 
275 280 285 

Ser Phe Glu Gly Arg He Cys Ala Cys Pro Gly Arg Asp Arg Lys Ala 
290 295 300 
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Asp Glu Asp His Tyr Arg Glu Gin Gin Ala Leu Asn Glu Ser Ser Ala 
305 310 * 315 320 

Lys Asn Gly Ala Ala Ser Lys Arg Ala Phe Lys Gin Ser Pro Pro Ala 
325 330 335 

Val Pro Ala Leu Gly Ala Gly Val Lys Lys Arg Arg His Gly Asp Glu 
340 345 350 

Asp Thr Tyr Tyr Leu Gin Val Arg Gly Arg Glu Asn Phe Glu lie Leu 
355 360 365 

Met Lys Leu Lys Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gin Pro 
370 375 380 

Leu Val Asp Ser Tyr Arg Gin Gin Gin Gin Leu Leu Gin Arg Pro Ser 
385 390 395 400 

His Leu Gin Pro Pro Ser Tyr Gly Pro Val Leu Ser Pro Met Asn Lys 
405 410 415 

Val His Gly Gly Met Asn Lys Leu Pro Ser Val Asn Gin Leu Val Gly 
420 425 430 

Gin Pro Pro Pro His Ser Ser Ala Ala Thr Pro Asn Leu Gly Pro Val 
435 440 445 

Gly Pro Gly Met Leu Asn Asn His Gly His Ala Val Pro Ala Asn Gly 
450 455 460 

Glu Met Ser Ser Ser His Ser Ala Gin Ser Met Val Ser Gly Ser His 
465 470 475 480 

Cys Thr Pro Pro Pro Pro Tyr His Ala Asp Pro Ser Leu Val Arg Thr 
485 490 495 

Trp Gly Pro 



(2) INFORMATION POUR LA SEQ ID NO: 20: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 17 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : simple 
<D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 

(iii) HYPOTHETIQUE: NON 

(iii) ANT I -SENS : NON 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 20: 
GCGAGCTGCC CTCGGAG 

(2) INFORMATION POUR LA SEQ ID NO: 21: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 



(iii) ANTI-SENS: OUI 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 21: 
GGTTCTGCAG GTGACTCAG 

(2) INFORMATION POUR LA SEQ ID NO: 22: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) ANTI-SENS: NON 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 22: 
GCCATGCCTG TCTACAAG 

(2) INFORMATION POUR LA SEQ ID NO: 23: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) ANTI-SENS: OUI 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 23: 
ACCAGCTGGT TGACGGAG 

(2) INFORMATION POUR LA SEQ ID NO: 24: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) ANTI-SENS: NON 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 24: 
GTCAACCAGC TGGTGGGCCA G 

(2) INFORMATION POUR LA SEQ ID NO: 25: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 16 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 



(iii) ANTI-SENS: OUI 



• 




WO 97/28186 



75 



PCT7FR97/00214 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 25: 
GTGGATCTCG GCCTCC 

(2) INFORMATION POUR LA SEQ ID NO: 26: 

(l) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 17 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) ANTI-SENS: NON 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 26: 
AGGCCGGCGT GGGGAAG 

(2) INFORMATION POUR LA SEQ ID NO: 27: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) ANT I -SENS : OUI 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 27: ■ 
CTTGGCGATC TGGCAGTAG 

(2) INFORMATION POUR LA SEQ ID NO: 28: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 17 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) ANTI-SENS: NON 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 28: 
GCGGCCACGA CCGTGAC 

(2) INFORMATION POUR LA SEQ ID NO: 29: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 



(iii) ANTI-SENS: OUI 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 29: 
GGCAGCTTGG GTCTCTGG 

(2) INFORMATION POUR LA SEQ ID NO: 30: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: acide nucleique 
<C) N OMBRE DE BRINS: simple 
(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 

(iii) ANTI-SENS: NON 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 30: 
CTGTACGTCG GTGACCCC 

(2) INFORMATION POUR LA SEQ ID NO: 31: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) ANTI-SENS: OUI 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 31: 
TCAGTGGATC TCGGCCTC 

(2) INFORMATION POUR LA SEQ ID NO: 32: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) ANTI-SENS: NON 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 32: 
AGGGGAC GC A GCGAAACC 

(2) INFORMATION POUR LA SEQ ID NO: 33: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 



(iii) ANTI-SENS: OUI 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 33: 
CCATCAGCTC CAGGCTCTC 

(2) INFORMATION POUR LA SEQ ID NO: 34: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) ANTI-SENS: OUI 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 34: 
CCAGGACAGG CGCAGATG 

(2) INFORMATION POUR LA SEQ ID NO: 35: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) ANTI-SENS: OUI 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 35: 
GATGAGGTGG CTGGCTGGA 

(2) INFORMATION POUR LA SEQ ID NO: 36: 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) ANTI-SENS: OUI 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 36: 
TGGTCAGGTT CTGCAGGTG 

(2) INFORMATION POUR LA SEQ ID NO: 37: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 



(iii) ANTI-SENS: NON 
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<xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 37: 
CACCTACTCC AGGGATGC 

(2) INFORMATION POUR LA SEQ ID NO: 38: 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 21 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) ANTI-SENS: OUI 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 38: 
AGGAAAATAG AAGCGTCAGT C 21 
(2) INFORMATION POUR LA SEQ ID NO: 39: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) ANTI-SENS: NON 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 39: 
CAGGCCCACT TGCCTGCC 

(2) INFORMATION POUR LA SEQ ID NO: 40: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) ANTI-SENS: OUI 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 40: 
CTGTCCCCAA GCTGATGAG 
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REVENDICATIONS 

1 . Polypeptide purifie, comprenant une sequence d'acides amines choisie parmi : 
a) la sequence SEQ ID n° 2 ; 

5 b) la sequence SEQ ID n° 4 ; 

c) la sequence SEQ ID n° 6 ; 

d) la sequence SEQ ID n° 8 ; 

e) la sequence SEQ ID n° 10 ; 

f) la sequence SEQ ID n°13 ; 
10 g) la sequence SEQ ID n° 15 ; 

h) la sequence SEQ ID n° 17 ; 

i) la sequence SEQ ID n° 19 ; 

et j) toute sequence biologiquement active derivee de SEQ ID n° 2, SEQ ID n° 4, 
SEQ ID n° 6, SEQ ID n° 8, SEQ ID n° 10, SEQ ID n°13, SEQ ID n° 15, SEQ ID n° 17 
15 ouSEQIDn°19. 

2. Polypeptide selon la revendication 1, caracterise en ce qu'il comprend la sequenc 
decides amines choisie parmi SEQ ID n° 6 t SEQ ID n° 13, SEQ ID n° 15, SEQ ID 
n°17et SEQ ID n° 19. 

20 

3. Polypeptide selon la revendication 1, caracterise en ce qu'il comprend la sequence 
comprise entre : 

- le residu 1 10 et le residu 310 de SEQ ID n° 2 ou 6 ; 

- le residu 60 et le residu 260 de SEQ ID n° 8. 

25 

4. Polypeptide selon la revendication 1 , caracterise en ce qu'il resulte d'un epissage 
altematif de TARN messager du g6ne correspondant 

5. Polypeptide selon Tune quelconque des revendications precedentes, caracterise 

30 

en ce qu'il s'agit d'un polypeptide recombinant produit sous la forme d'une proteine 
de fusion. 



35 



6. 



Sequence d'acides nucleiques isolee codant pour un polypeptide selon Tune 
quelconque des revendications precedentes. 



WO 97/28186 



80 



PCTYFR97/00214 



7. Sequence d'acides nucleiques isolee selon la revendication 6, caracterisee en ce 
qu'elle est choisie parmi : 

a) la sequence SEQ ID n° 1 ; 

b) la sequence SEQ ID n° 3 ; 

c) la sequence SEQ ID n° 5 ; 

d) la sequence SEQ ID n°7 ; 

e) la sequence SEQ ID n°9 ; 

f ) la sequence SEQ ID n° 11 ; 

g) la sequence SEQ ID n° 12 ; 

h) la sequence SEQ ID n° 14 ; 

i) la sequence SEQ ID n° 16 ; 
j) la sequence SEQ ID n° 18 ; 

k) les sequences d'acides nucleiques capables de s'hybrider specifiquement a la 
sequence SEQ ID n° 1, SEQ ID n° 3, SEQ ID n° 5, SEQ ID n°7, SEQ ID n°9, SEQ 
ID n° 11, SEQ ID h°12, SEQ ID n° 14, SEQ ID n° 16 ou SEQ ID n° 18 ou a leurs 
sequences complementaires, ou de s'hybrider specifiquement a leurs sequences 
proximales.; 

et I) les sequences derivees des sequences a), b), c) t d), e), f). g), h), i), j) ou k) du 
fait de la degenerescence du code genetique, de mutation, de deletion, d'insertion, 
d'un epissage alternatif ou d'une variability allelique. 

8. Sequence nucleotidique selon la revendication 6, caracterisee en ce qu'il s'agit 
d'une sequence choisie parmi SEQ ID n° 5, SEQ ID n° 12, SEQ ID n° 14, SEQ ID 
n° 16 et SEQ ID n° 18 codant respectivement pour le polypeptide de sequences 
SEQ ID n° 6, SEQ ID n° 13, SEQ ID n° 15, SEQ ID n° 17 et SEQ ID n° 19. 

9. Vecteur de clonage et/ou ^expression contenant une sequence d'acides 
nucleiques selon Tune quelconque des revendications 6 a 8. 

10. Vecteur selon la revendication 9, caracterise en ce qu'il s'agit du plasmide pSE1. 

11. Cellule hdte transfectee par un vecteur selon la revendication 9 ou 10. 

12. Cellule hdte transfectee selon la revendication 11, caracterisee en ce qu'il s'agit 
de£. co/ZMC 1061. 
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13. Sonde nucleotidique ou amorce nucleotidique caracterisee en ce qu'elle s'hybride 
specifiquement avec I'une quelconque des sequences selon les revendications 6 
a 8 ou leurs sequences complementaires ou les ARN messagers correspondants 
ou les genes correspondants. 

14. Sonde ou amorce selon la revendication 13, caracterisee en ce qu'elle comporte 
au moins 16 nucleotides. 

15. Sonde ou amorce selon la revendication 13, caracterisee en ce qu'elle comprend 
I'integralite de la sequence du gene codant pour i'un des polypeptides de la 
revendication 1. 



16. Sonde ou amorce nucleotidique choisie parmi les oligonucleotides suivants ou 
leurs complementaires : 
SEQ ID n° 20 : GCG AGC TGC CCT CGG AG 
SEQ ID n° 21 : GGT TCT GCA GGT GAC TCA G 
SEQ ID n° 22 : GCC ATG CCT GTC TAC AAG 
SEQ ID n° 23 : ACC AGC TGG TTG ACG GAG 
SEQ ID n° 24 : GTC AAC CAG CTG GTG GGC CAG 
SEQ ID n° 25 : GTG GAT CTC GGC CTC C 
SEQ ID n° 26 : AGG CCG GCG TGG GGA AG 
SEQ ID n° 27 : CTT GGC GAT CTG GCA GTA G 
SEQ ID n° 28 : GCG GCC ACG ACC GTG AC 
SEQ ID n° 29 : GGC AGC TTG GGT CTC TGG 
SEQ ID n° 30 : CTG TAC GTC GGT GAC CCC 
SEQ ID n° 31 : TCA GTG GAT CTC GGC CTC 
SEQ ID n° 32 : AGG GGA CGC AGC GAA ACC 
SEQ ID n* 33 : CCA TCA GCT CCA GGC TCT C 
SEQ ID n° 34 : CCA GGA CAG GCG CAG ATG 
SEQ ID n° 35 : GAT GAG GTG GCT GGC TGG A 
SEQ ID n° 36 : TGG TCA GGT TCT GCA GGT G 
SEQ ID n° 37 : CAC CTA CTC CAG GGA TGC 
SEQ ID n° 38 : AGG AAA ATA GAA GCG TCA GTC 
SEQ ID n° 39 : CAG GCC CAC TTG CCT GCC 
et SEQ ID n° 40 : CTG TCC CCA AGC TGA TGA G 
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17. Utilisation d'une sequence selon I'une quelconque des revendications 6 a 8 pour 
la fabrication d'amorces oligonucleotidiques pour des reactions de sequengage 
ou d'amplification specifique seton la technique de PCR ou toute variante de 
celle-ci. 

18. Couple d'amorces nucleotidiques, caracterise en ce qu'il comprend les amorces 
choisies parmi les sequences suivantes : 



10 



15 



a) amorce sens : GCG AGC TGC CCT CGG AG (SEQ ID n° 20) 
amorce antisens : GGT TCT GCA GGT GAC TCA G (SEQ ID n° 21) 

b) amorce sens : GCC ATG CCT GTC TAC AAG (SEQ ID n°22) 
amorce antisens : ACC AGC TGG TTG ACG GAG (SEQ ID n° 23) 

c) amorce sens : GTC AAC CAG CTG GTG GGC CAG (SEQ ID n° 24) 
amorce antisens : GTG GAT CTC GGC CTC C (SEQ ID n° 25) 



d) amorce sens : AGG CCG GCG TGG GGA AG (SEQ ID n° 26) 

2Q 

amorce antisens : CTT GGC GAT CTG GCA GTA G (SEQ ID n° 27) 

e) amorce sens :GCG GCC ACG ACC GTG A (SEQ ID n° 28) 
amorce antisens : GGC AGC TTG GGT CTC TGG (SEQ ID n°29) 

25 f) amorce sens : CTG TAC GTC GGT GAC CCC (SEQ ID n°30) 

amorce antisens : TCA GTG GAT CTC GGC CTC (SEQ ID n° 31) 

g) amorce sens ; AGG GGA CGC AGC GAA ACC (SEQ ID n° 32) 
amorce antisens : GGC AGC TTG GGT CTC TGG (SEQ ID n° 29) 

30 

h) amorce sens : CCCCCCCCCCCCCCN (ou N est egal a G, A ou T) 
amorce antisens : CCA TCA GCT CCA GGC TCT C (SEQ ID n° 33) 

i) amorce sens : CCCCCCCCCCCCCCN (ou N est egal a G AouT) 
35 ' 

amorce antisens : CCA GGA CAG GCG CAG ATG (SEQ ID n° 34) 
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j) amorce sens :CCCCCCCCCCCCCCCN (ou N est egai a G f A ou T) 
amorce antisens : CTT GGC GAT CTG GCA GTA G (SEQ ID n° 27) 

k) amorce sens :CAC CTA CTC CAG GGA TGC (SEQ ID n° 37) 
5 amorce antisens : AGG AAA ATA GAA GCG TCA GTC (SEQ ID n° 38) 

et I) amorce sens :CAG GCC CAC TTG CCT GCC (SEQ ID n° 39) 

amorce antisens : CTG TCC CCA AGC TGA TGA G (SEQ ID n° 40). 

10 

19. Utilisation cTune sequence selon Tune queiconque des revendications 6 a 8, 
utilisable en therapie genique. 



15 



20 



25 



30 
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20. Utilisation d'une sequence selon Tune queiconque des revendications 6 a 8,. pour 
la realisation de sondes ou d'amorces nucleotidiques de diagnostic, ou de 
sequences antisens utilisables en therapie genique. 

21. Utilisation d'amorces nucleotidiques selon Tune queiconque des revendications 6 
a 8 pour le sequen^age. 

22. Utilisation d'une sonde ou amorce selon Tune queiconque des revendications 13 
a 16, comme outil de diagnostic in vitro pour la detection, par des experiences 
d'hybridation, des sequences d'acides nucleiques codant pour un polypeptide 
selon Tune queiconque des revendications 1 a 4, dans des echantillons biofogi- 
ques, ou pour la mise en evidence de syntheses aberrantes ou d'anomali s 
genetiques. 

23. Methode de diagnostic in vitro pour la detection de syntheses aberrantes ou 
d'anomalies genetiques au niveau des sequences d'acides nucleiques codant 
pour un polypeptide selon Tune queiconque des revendications 1 a 4, 
caracterisee en ce qu'elle comprend : 

- la mise en contact d'une sonde nucleotidique selon Tune queiconque des 
revendications 13 £ 16 avec un echantillon biologique dans des conditions 
permettant la formation d'un complexe d'hybridation entre ladite sonde et la 
susdite sequence nucleotidiqu , eventuell ment apr's une etape prealable 
d'amplification de la susdite sequ nc nucl 'otidique ; 
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- la detection du complexe d'hybridation eventuellement forme ; 

- eventuellement le sequencage de la sequence nucleotidique formant le 
complexe d'hybridation avec fa sonde de I'invention. 

5 24. Utilisation d'une sequence d'acides nucleiques selon I'une quelconque des - 
revendications 6 a 8, pour la production d'un polypeptide recombinant selon I'une 
quelconque des revendications 1 a 5. 



25. Methode de production d'une proteine recombinante SR-p70, caracterisee en ce 
que Ton cultive des cellules transferees selon la revendication 10 ou 11 dans 
des conditions permettant I'expression d'un polypeptide recombinant de 
sequence SEQ ID n° 2, SEQ ID n° 4, SEQ ID n°6, SEQ ID n° 8, SEQ ID n° 10, 
SEQ ID n°13, SEQ ID n° 15, SEQ ID n° 17 ou SEQ ID n° 19 ou tout fragment ou 
derive biologiquement actif, et que I'on recupere ledit polypeptide recombinant. 

26. Anticorps mono ou polyclonaux ou leurs fragments, anticorps chimeriques ou 
immunoconjugues, caracterises en ce qu'ils sont capables de reconnaftre specifi- 
quement un polypeptide selon I'une quelconque des revendications 1 a 4. 

27. Utilisation des anticorps selon la revendication precedente, pour la purification ou 
la detection d'un polypeptide selon I'une quelconque des revendications 1 a 4 
dans un echantillon biologique. 



. Procede de diagnostic in vitro de pathologies correlees a une expression ou un 
accumulation anormale de proteines SR-p70, notamment les phenomen s de 
cancerisation, a partir d'un prelevement biologique. caracterise en ce que I'on 
met en contact au moins un anticorps selon la revendication 25 avec ledit 
prelevement biologique, dans des conditions permettant la formation eventuell 
de complexes immunologiques specifiques entre une proteine SR-p70 et le ou 
lesdits anticorps et en ce que Ton detecte les complexes immunologiques specifi- 
ques eventuellement formes. 
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Kit pour le diagnostic in vitro d'une expression ou une accumulation anormale de 
proteines SR-p70 dans un prelevement biologique et/ou pour la mesure du taux 
d'expression de celles-ci dans ledit prelevement comprenant : 
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- au moins un anticorps selon la revendication 25, eventuellement fixe sur un 
support, 

- des moyens de revelation de la formation de complexes antigenes/anticorps 
specifiques entre une proteine SR-p70 et ledit anticorps et/ou des moyens de 

5 quantification de ces complexes. 

30. Methode pour le diagnostic precoce de la formation des tumeurs caracterisee en 

ce que Ton met en evidence dans un echantillon de serum preleve chez un 

f individu des auto-anticorps diriges contre une proteine SR-p70 selon les etapes 
10 • 

consistant a mettre en contact un echantillon de serum preleve chez un individu 
avec un polypeptide de I'invention, eventuellement fixe sur un support, dans des 
conditions permettant la formation de complexes immunologiques specifiques 
entre ledit polypeptide et les auto-anticorps eventuellement presents dans 
I'echantillon de serum, et en ce que Ton detecte les complexes immunologiques 
15 specifiques eventuellement formes. 



31. Methode de determination d'une variabilite all6lique, d'une mutation, d'une 
deletion, d'une insertion, d'une perte d'heterozygotie ou d f une anomalie 
genetique du gene SR-p70 caracterisee en ce qu'elle utilise au moins une 
sequence nucleotidique selon Tune quelconque des revendications 6 £ 8. 

32. Methode de determination d'une variabilite allelique du gene SR-p70 au niveau 
de la position -30 et -20 par rapport a I'ATG d'initiation de I'exon 2 pouvant etre 
impliquee dans des pathologies et caracterisee en ce qu'elle comprend au moins: 

- une 6tape au cours de laquelle on precede a I'amplification par PCR de I'exon 2 
du gene SR-p70 portant la sequence cible a raide de couple d'amorc s 
oligonucleotidiques selon Tune quelconque des reyendications 6 a 8; 

- une etape au cours de laquelle on precede au traitement des produits amplifies 
par un enzyme de restriction dont le site de coupure correspond a I'airie 
recherche; 

- une etape au cours de laquelle on precede a la detection ou au dosage d'au 
moins Tun des produits de la reaction enzymatique. 
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. Composition pharmaceutique comprenant, a titre de principe actif, un polypeptide 
s Ion Tune qu Iconque des revendications 1 £ 4. 
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34. Composition pharmaceutique selon la revendication precedente, caracterisee en 
ce qu'elle comprend un polypeptide selon la revendication 2. 

35. Composition pharmaceutique contenant un inhibiteur ou un activateur de I'activite 
5 du SR-p70. 

36. Composition pharmaceutique contenant un polypeptide derive d'un polypeptide 
selon I'une quelconque des revendications 1 a 5 caracterise en ce qu'il est un 
inhibiteur ou un activateur du SR-p70. \ 

10 
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REVINDICATIONS MODIFIES 

[re9ues par le Bureau international le 26 aout 1997 (26.08.97); 
revendication 13 modifiee; autres revendications inchangees (1 page)] 

Sonde nucleotidique ou amorc nucleotidique caracteris6 n ce qu* He s'hybride 
specifiquement dans des conditions stringentes avec Tune quelconque des 
sequences selon les revendications 6 a 8 ou leurs sequences complementaires 
ou les ARN messagers correspondants ou les genes correspondants. 

Sonde ou amorce selon la revendication 13, caracterisee en ce qu'elle comporte 
au moins 16 nucleotides. 

15. Sonde ou amorce selon la revendication 13, caracterisee en ce qu'elle comprend 
l integralite de la sequence du g6ne codant pour Tun des polypeptides de la 
revendication 1. 



13. 



14. 



16. Sonde ou amorce nucleotidique choisie parmi les oligonucleotides suivants ou 



15 



20 



25 



30 
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leurs 


complementaires : 


SEQ 


ID 


n" 


20 


GCG AGC TGC CCT CGG AG 


SEQ 


ID 


n° 


21 


GGT TCT GCA GGT GAC TCA G 


SEQ 


ID 


n° 


22 


GCC ATG CCT GTC TAC AAG 


SEQ 


ID 


n" 


23 


ACC AGC TGG TTG ACG GAG 


SEQ 


ID 


n" 


24 


GTC AAC CAG CTG GTG GGC CAG 


SEQ 


ID 


n" 


25 


GTG GAT CTC GGC CTC C 


SEQ 


ID 


n" 


26 


AGG CCG GCG TGG GGA AG 


SEQ 


ID 


n° 


27 


CTT GGC GAT CTG GCA GTA G 


SEQ 


ID 


n" 


28 


GCG GCC ACG ACC GTG AC 


SEQ 


ID 


n" 


29 


GGC AGC TTG GGT CTC TGG 


SEQ 


ID 


n° 


30 


CTG TAC GTC GGT GAC CCC 


SEQ 


ID 


n° 


31 


TCA GTG GAT CTC GGC CTC 


SEQ 


ID 


n" 


32 


AGG GGA CGC AGC GAA ACC 


SEQ 


ID 


n" 


33 


CCA TCA GCT CCA GGC TCT C 


SEQ 


ID 


n" 


34 


CCA GGA CAG GCG CAG ATG 


SEQ 


ID 


n" 


35 


GAT GAG GTG GCT GGC TGG A 


SEQ 


ID 


n" 


36 


TGG TCA GGT TCT GCA GGT G 


SEQ 


ID 


n° 


37 


CAC CTA CTC CAG GGA TGC 


SEQ 


ID 


n" 


38 


AGG AAA ATA GAA GCG TCA GTC 


SEQ 


ID 


n° 


39 . 


CAG GCC CAC TTG CCT GCC 


et SEQ ID 


n° 40 : CTG TCC CCA AGC TGA TGA G 



FEU1LLE MODIFIEE (ARTICLE 19) 
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1 TGCCTCCCCGCCCGCGCACCCGCCCCGAGGCCTGTGCTCCTGCGAAGGGG 50 

II I I I I 

1 GGGGCTCCGGGG 12 

51 AC GC AGCG AAGCCGGGGCCCG CGCC AGGCCGGCCGGG ACGG ACG C CG ATG 100 

I I I I Mill II I III II I 

13 ACACTTGGCGTCCGGGCTGGAAGCGTGCTTTCCAAGACGGTGACACGCTT 62 

101 CCCGGAGCTGCGACGGCTGCAGAGCGAGCTGCCCTCGGAGGCCGGTGTGA 150 

I I I I I I I I I I III I I I I II I II 

63 CCCTGAGGATTGGCAGCCAGACTGCTTACGGGTCAC. . . TGCCATGGAGG 109 

151 GGAAGATGGCCCAGTCCACCACCACCTCCCCCGATGGGGGCACCACGTTT 2 00 

I I I I I III III INI I II III 

110 AGC C GC AGTC AG ATC C C AGC ATCG AGC CCC CTCTG AGTC AGG AAAC ATTT 159 

201 G AGC ACCTCTGG AGCTCTCTGGAACCAG AC AGC ACCTACTTCG ACCTTCC 2 50 

Mil Mil II I III I I II Mill 

160 TCAGACCTATGGAAACTACTTCCTGAAAACAAC . GTTCTGTCCCCCTTGC 208 

251 CCAGTCAAGCCGGGGGAATAATGAGGTGGTGGGTGGCACGGATTCCAGCA 300 

I Mill I II III II 1 1 II II I 

209 C GT CC C AAGCGGTGG ATG ATTTG ATGCTCT C TC CGG ATG AT CTTGC AC AA 2 58 
301 TGGACGTCTTCCACCTAGAGGGCATGACCACATCTGTCATGGCCCAGTTC 3 50 

III I I I I Mill II 

25 9 TGG TTAACTGAAGACCCAGGTC 2 80 

351 AATTTGCTGAGCAGCACCATGGACCAGATGAGCAGCCGCGCTGCCTCGGC 400 

I II I I Mill Ml II II I 

281 CAGATGAAGCTC CCAGAATGTCAGAGGCTGCTCCCCACA 319 

401 CAGCCCGTACACCCCGGAGCACGCCGCCAGCGTGCCCACCCATTCACCCT 450 

MM Mill I MM Ml III I Ml 

32 0 TGGCCCCCACACCAGCAGCTCCTACACCGGCGGCCCCTGCACCAGCCCC . 368 
451 ACGCACAGCCCAGCTCCACCTTCGACACCATGTCGCCCGCGCCTGTCATC 500 

I M II! 1 I II 

369 CTCCTGGCCCCTGTCATCCTCTGTC 393 

501 CCCTCCAACACCGACTATCCCGGACCCCACCACTTCGAGGTCACTTTCCA 550 

II Ml II III I III I II III I MM 

394 CCTTCCCAGAAAACCTACCACGGCAGCTACGGTTTCCGTCTGGGCTTCCT 443 

551 GCAGTCCAGCACGGCCAAGTCAGCCACCTGGACGTACTCCCCACTCTTGA 600 

III II I M I E 1 1 1 1 f ! I II II IMIMIMM I I I 

444 GCATTCTGGAACAGCCAAGTCTGTGACTTGCACGTACTCCCCTGACCTCA 493 

601 AGAAACTCTACTGCCAGATCGCCAAGACATGCCCCATCCAGATCAAGGTG 650 

I I I I JMIMI I I t I 1 I I 1 [ MIMI I III I III 
494 ACAAGATGTTTTGCCAGCTGGCCAAGACCTGCCCCGTGCAGCTGTGGGTT 543 

651 TCCGCCCCACCGCCCCCGGGCACCGCCATCCGGGCCATGCCTGTCTACAA 700 

II MM II II MM I I MM MIMI I lllllll 

544 GATTCCACACCCCCGCCCGGCAGCCGCGTCCGCGCCATGGCCATCTACAA 593 
701 GAAGGCGGAGCACGTGACCGACATCGTGAAGCGCTGCCCCAACCACGAGC 750 

I II I Mill MM II MIMI llllllllll MM MM 

594 GCAGTCACAGCACATGACTGAGGTCGTGAGGCGCTGCCCCCACCATGAGC 643 
751 TCGGGAGGGACTTCAACGAAGGACAGTCTGCCCCAGCCAGCCACCTCATC 800 

II Ml I I I I Mill I II II III 

644 GCTGCTCAGACAGCGATGGA CTGGCCCCTCCTCAACATCTTATC 687 

801 CGTGTGGAAGGCAATAATCTCTCGCAGTATGTGGACGACCCTGTCACCGG 850 

II IMIIMI III I I Mill III III Ml 

688 C G AGTGG AAGG AAATTTGCGTGTGG AGT ATTCGG ATG AC AG AAAC AC TTT 737 
851 CAGGCAGAGCGTCGTGGTGCCCTATGAGCCACCACAGGTGGGGACAGAAT 900 

I II II II I II II I II 1 1 II I II 1 1 II MM II Mil 

738 TCGAC AT AGTGTGGTGGTGCCCTATGAGC CGCCTG AGGTTGGC TCTG ACT 787 
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901 TCACCACCATCCTGTACAACTTCATGTGTAACAGCAGCTGTGTGGGGGGC 95 0 

, QD n iii mi ii 1 1 m ii t i 1 1 1 1 1 m 1 1 1 r in Minn 

7 88 GTACCACCATCCACTACAACTACATGTCTAACAGTTCCTGCATG^GGC 837 
951 ATGAACCGACGGCCCATCCTCATCATCATCACCCTGGAGACGCGGGATGG 1000 

fl . Q I M I 1 1 1 1 IMIIIMIIM II Mill Mill mi 

838 ATGAACCGGAGGCCCATCCTCACAATTATCACACTGGAAGACTCCAGTGG 887 
1001 GCAGGTGCTGGGCCGCCGGTCCTTCGAGGGCCGCATCTGCGCCKrrCCTG 1050 

DQO I I Mill II III MM M I M IMMIMM 

888 TAATCTACTGGGACGGAACAGCTTTGAGGTGCGAGTTTGTGCCTC 937 
1051 GCCGCGACCGAAAAGCCGATGAGGACCACTACCGGGAGCAGCAGGCCTTG 1100 

Q „ I I UNI I II II II I I || | 

93 8 GGAGAGACCGGCGCACAGAGGAAGAGAATTTCC g 971 

1101 AATG AGAGCTCCGCCAAGAACGGGGCTGCC AGC AAGCGCGCCTTCAAGCA 1150 

i 1 1 M Mil I I II II I I I M I 

97 2 CAAGAAAGGGGAGCCTTGCCACGAGCTGCCCCCTGGGAGCACTAAGCGAG 1021 
1151 G AGTCCCCCTGCCGTCCCCGCCCTGGGCCC . GGGTGTGAAGAAGCGGCGG 1199 

Mill II Ml III I IIMI I I I I 

102 2 CACTGCCCAACAACACCAGCTCCTCTCCCCAGCCAAAGAAGAAACCACTG 1071 
12 00 CACGGAGACGAGGACACGTACTACCTGCAGGTGCGAGGCCGCGAGAACTT 1249 

I Mill I Ml Ml Ml I II II II Ml III 

107 2 GATGGAGAATATTTCAC CCTTCAGATCCGCGGGCGTGAGCGCTT 1115 

12 50 CG AGATCCTGATGAAGCTGAAGGAGAGCCTGGAGCTG ATGGAGTTGGTGC 12 99 

I UNI ! 1 1 1 II I I Ml I MM Ml III 

1116 CGAGATGTTCCGAGAGCTGAATGAGGCCTTGGAACTCAAGGA 



1157 

1300 CGCAGCCGCTGGTAGACTCCTATCGGCAGCAGCAGCAGCTCCTACAGAGG 134 9 

n „ II MMI I I Mill I Mill MM) 

1158 TGCCCAGGCTGGGAAAGAGCCAGCGG. . GGAGCAGGGCTCACTCCAGCCA 1205 

13 50 CCGAGTCACCTACAGCCCCCATCCTACGGGCCGGTCCTCTCGCCCATGAA 1399 

N HI I II MM III 

12 06 CCTGAAGTCCAAGAAGGGGCAATCTACCTCCCGCCATAAAAAATTCATGT 1255 

14 00 CAAGGTGCACGGGGGCGTGAACAAGCTGCCCTCCGTCAACCAGCTGGTGG 14 49 
„ cjr I I Nil I II III I I I MMI I | 

12 56 TCAAGACAGAGGGGCCTGACTCAGACTGACATTC TCAGCTTCTTG 1300 

14 50 GCCAGCCTCCCCCGCACAGCTCGGC^^ 1499 

1301 TTCCCCCACTGAGCCICCCACCCCCATCT 1349 

1500 GGCTCTGGGATGCTCAACAACCACGGCCACGCAGTGCCAGCCAACAGCGA 1549 
,, CA I MUM I III I II Ml I M III I 

13 50 AGTTCTGGGTCTTTAAACCCTTGCTTGCAATAGGTGTGTGTCAGAAGCAA 1399 

1550 GATGACCAGCAGCCACGGCACCCAGTCCATGGTCTCGGGGTCCCACTGCA 1599 
1400 A 1400 
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1 MAQSTTTSPDGGTTFEHLWSSLEPDSTYFDLPQSSRGNNEVVGGTDSSMD 50 

..|:::..:|. :| :.|s || . .:|| : . .:| 

1 MEEPQSDPSIEPPLS. . . . QETFSDLWKLLPENNVLSPLPSQAVD 41 

51 VFHLEGMTTSVMAQFNLLSSTMDQMSSRAASASPYTPEHAASVPTHSPYA 100 

= I • • ■ : I h • - - t : I - - • I - - I I . - I - - I : 

42 DLML. . .SPDDLAQWLTEDPGPDEAPRMSEAAPHMAPTPAAPTPA.APAP 87 

101 QPSSTFE)TMSPAPVIPSNTDYPGPHHFEVTFQQSSTAKSATWTYSPLLKK 150 

-II--: :||..-|.|.. I :.| :|:||II-| INI I - I 

8 8 APSWPL S S SVP SQKT YHGS YGFRLGFLHSGTAK SVTCTY S PDLNK 13 2 

151 LYCQ I AKTC P I Q I K VSAP P PPGTAIRAMPVYKKAEHVTD IVKRCPNHELG 200 

::||:||I||:|:.|...||M- = I II : = II \ = I : : h I I I : I I 

13 3 MFCQUAJCTCPVQLWVDSTPPPGSRVRAMAIYKQSQHMTEVVRRCPHHE. . 180 

2 01 RDFNEGQSAPASHLIRVEGNNLSQYVDDPVTGRQSVVVPYEPPQVGTEFT 250 

I Ih llllllll H II- I I : I I I I I I I I I = I I - : I 

181 RCSDSDGLAPPQHLIRVEGNLRVEYSDDRNTFRHSVWPYEPPEVGSDCT 23 0 

251 T I LYNFMCNSSCVGGMNRRP IL 1 1 ITLETRDGQVLGRRSFEGRICAC PGR 3 00 

II I I : I I ! I I h I I I I M I I I - I I I I I - - : • I - : I II - I I I - h i I I 1 I I 

231 T I H YNYMCN S S CMGGMNRR P I LT I ITLED S SGNLLGRN S FEVRVCAC PG R 2 80 

301 DRKADEDHY REQQ ALNES S AKNG AASKRAFKQS P P AVP AL*G PGVKKRRHG 3 50 

||:.:| = :s|... • .:..|||: I- -|::. 

2 81 DRRTEEENFRKKG . . EPCHELPPGSTKRALPNNTSSSPQ PKKKPL 323 

351 DEDTYYLQVRGRENFEILMKLKESLELMELVPQPLVDSYRQQQQLLQRPS 400 

|:: : | | : | | | | . || = = - ■ I - I - I I I • : - • - - • : I • : I---- 

324 DGEYFTLQIRGRERFEMFRELNEALELKDAQAGKEPAGSRAHSSHLKSKK 37 3 

401 HLQPPSYGPVLSPMNKVHGGVNKLPSVNQLVGQPPPHSSAATPNLGPVGS 450 

374 GQSTSRHKKFMFKTEGPDSD 393 
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1 TGCCTCCCCGCCCGCGCACCCGCCCCGAGGCCTGTGCTCCTGCGAAGGGG 50 

, NIINNIIIIflMMIIIIIMIIIIMIMIIMIIIillllllll 

1 TGCCTCCCCGCCCGCGCACCCGCCCCGAGGCCTGTGCTCCTGCGAAGGGG 50 
51 ACGCAGCGAAGCCGGGGCCCGCGCCAGGCCGGCCGGGACGGACGCCGATG 100 

I M I M I I M MM I I I I lilli I I MMMI M II I I I 1 Ml II M I M 

51 ACGCAGCGAAGCCGGGGCCCGCGCCAGGCCGGCCGGGACGGACGCCGATG 100 
101 CCCGGAGCTGCGACGGCTGCAGAGCGAGCTGCCCTCGGAGGCCGGTGTGA 150 

Ml I M M I M M MMMMI M MIM M MMM M M MMMMI 

101 CCCGGAGCTGCGACGGCTGCAGAGCGAGCTGCCCTCGGAGGCCGGTGTGA 150 
151 GG AAGATGGCCCAGTCC AC CACCACCTCCCCCGATGGGGGCACCACGTTT 2 00 

M M M M M MM II MMM M I MM I I MMM I MMMI M M I 

151 GG AAG ATGGCCC AG TCCACC AC C ACCTCCCCCG ATGGGGGC ACC ACGTTT 200 
201 GAGCACCTCTGGAGCTCTCTGGAACCAGACAGCACCTACTTCGACCTTCC 250 

i M I 1 1 I 1 1 1 1 1 I 1 1 M 1 1 I ) M II 1 1 1 1 1 1 1 1 1 1 1 If 1 1 1 1 1 1 1 1 M 1 1 

201 GAGCACCTCTGGAGCTCTCTGGAACCAGACAGCACCTACTTCGACCTTCC 250 
251 C C AG TCAAGC CGGGGG AAT AATGAGGTGGTGGGTGGC ACGG ATTCC AGC A 300 

M I II M ! 1! MMM MMMM IMMMMMMIIIIIMIM Ml 

2 51 CCAGTCAAGCCGGGGGAATAATGAGGTGGTGGGTGGCACGGATTCCAGCA 300 
301 TGGACGTCTTCCACCTAGAGGGCATGACCACATCTGTCATGGCCCAGTTC 350 

I I I M Ml J! M MMMI IMMMMIIMM M MMMMMMM 

301 TGGACGTCTTCCACCTAGAGGGCATGACCACATCTGTCATGGCCCAGTTC 350 
351 AATTTGCTGAGCAGCACCATGGACCAGATGAGCAGCCGCGCTGCCTCGGC 400 

I II I II I I Ml II ! II I II I Ml I Mill II Ml I MIMMMIII Ml 

351 AATTTG CTG AGC AGCACC ATGG ACC AGATG AGCAGC CGCGCTGCCTCGGC 400 
401 CAGCCCGTACACCCCGGAGCACGCCGCCAGCGTGCCCACCCATTCACCCT 450 

M II I I MIM I I MIMIIMM MMMIIIMI MMMMMMM 

4 01 CAGCCCGTACACCCCGGAGCACGCCGCCAGCGTGCCCACCCATTCACCCT 450 
451 ACGCACAGCCCAGCTCCACCTTCGACACCATGTCGCCCGCGCCTGTCATC 500 

I I M M Ml I! M MM I II 1 1 1 MM M I II MM Ml MMMI MM 

451 ACGCACAGCCCAGCTCCACCTTCGACACCATGTCGCCCGCGCCTGTCATC 500 
501 CCCTCCAACACCGACTATCCCGGACCCCACCACTTCGAGGTCACTTTCCA 550 

M 1 1 M M I M II I MMM III MIMMMM III MMIMMMM 

501 CCCTCCAACACCGACTATCCCGGACCCCACCACTTCGAGGTCACTTTCCA 550 
551 GCAGTCCAGCACGGCCAAGTCAGCCACCTGGACGTACTCCCCACTCTTGA 600 

I I M II MM I II Mill MIMMIMMIIIMII M Ml! MMM! 

551 GCAGTCCAGCACGGCCAAGTCAGCCACCTGGACGTACTCCCCACTCTTGA 600 
601 AGAAACTCTACTGCCAGATCGCCAAGACATGCCCCATCCAGATCAAGGTG 650 

1 1 II M I M II M MM M I Ml I MMI I MM II I II IMMMIM I 

601 AGAAACTCTACTGCCAGATCGCCAAGACATGCCCGATCCAGATOUV^^ 650 

651 TCCGCCCCACCGCCCCCGGGCACCXXTC^TCCGGGCCATGCCTGTCTACAA 700 

1 1 1 M 1 1 1 1 1 i 1 1 1 i 1 1 1 1 1 1 1 i 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 i 1 1 i [ 

651 TCCGCCCCACCGCCCCOSGGCACCGCCAT<XXaXX:CAT 700 
701 GAAGGCGGAGCACGTGACCGACATCGTGAAGCGCTGCCCCAACCACGAGC 750 

I II I M ! 1 1 M 1 1 I III M IMMIM MIIIMM MMMIIIMI II 

701 GAAGGCGGAGCACGTGACCGACATCGTGAAGCGCTGCCCCAACCACGAGC 750 
751 TCGGGAGGGACTTCAACGAAGGACAGTCTGCCCCAGCCAGCCACCTCATC 800 

I I I I Ml MMI I III III MM MIMMIIIMMII IIMMIIIM 

7 51 TCGGGAGGGACTTCAACGAAGGACAGTCTGCCCCAGCCAGCCACCTCATC 800 



801 CGTGTGGAAGGCAATAATCTCTCGGAGTATGTGGACGACCCTGTCACCGG 850 

II M I IMMIM III Ml I II MIMMMMMMII IMMIIIIM 

801 CGTGTGGAAGGCAATAATCTCTCGCAGTATGTGGACGACCCTGTCACCGG 850 



FIG. 



851 CAGGCAGAGCGTCGTGGTGCCCTATGAGCCACCACAGGTGGGGACAGAAT 900 

1 1 1 1 1 1 1 MM II MMM MM MIMMMMMMI MIMMMM POnt 

851 CAGGCAGAGCGTCGTGGTGCCCTATGAGCCACCACAGGTGGGGACAGAAT 900 ^Vl I U 
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901 TC AC C ACC ATC CTG T AC AAC TTC ATGTGT AAC AGC AG CTG TG TGGGGGGC 95 0 

am 'li''l |MI| IIIMIMIIIIIIIIIIIIII||||||||||MiMII 

901 TCACCACCATCCTGTACAACTTCATGTGTAACAGCAGCTGTC^ 950 
951 ATGAACCGACGGCCCATCCTCATCATCATCACCCTGGAGACGCGGGATGG 1000 

qsi U' '''I 'I I N I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1| 1000 

951 ATGAACCGACGGCCCATCCTCATCATCATCACCCTGGAGACGCGGGATGG 1000 
1001 GCAGGTGCTGGGCCGCCGGTCCTTCGAGGGCCGCATCTGCGCCTGTCCTG 10 SO 

inni NIIIIMIMINIMIIIIIilllllllllMiillilllllllllli 

1001 GCAGGTGCTGGGCCGCCGGTCCTTCGAGGGCCGCATCTGCGCCTGTCCTG 1050 
1051 GCCGCGACCGAAAAGCCGATGAGGACCACTACCGGGAGCAGCAGGCCTTG 1100 

m,. JL JL ' JLJLJL IJL * " i * * i f i J ' 1 1 1 1 1 1 1 1 i 1 1 1 1 1 i 1 1 i 1 1 1 1 » 1 1 1 1 1 r 1 1 1 

1051 GCCGCGACCGAAAAGCCGATGAGGACCACTACCGGGAGCAGCAGGCCTTG 1100 
1101 AATGAGAGCTCCGCCAAGAACGGGGCTGCCAGCAAGCGCGCCTTCAAGCA 1150 

" i ini IWUiULL 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 lilt 

1101 AATGAGAGCTCCGCCAAGAACGGGGCTGCCAGCAAGCGCGCCTTCAAGCA 1150 

1151 GAGTCCCCCTGCCGTCCCCGCCCTGGGCCCGGGTGTGAAGAAGCGGCGGC 1200 
- 'i'l JL ' JL JLJL ' J.JL 1 1 1 I f I I t i I I I I | I I f | i f I J I I I I M I I I t I I I | | | 

1151 GAGTCCCCCTGCCGTCCCCGCCCTGGGCCCGGGTGTGAAGAAGCGGCGGC 1200 

12 01 ACGGAGACGAGGACACGTACTACCTGCAGGTGCGAGGCCGCGAGAACTTC 12 5 0 

loni I JL I I M 1 1 M 1 1 1 M I J M f 1 1 M M 1 1 M 1 1 I f f M i 1 1 M 1 1 1 1 1 1 M 

1201 ACGGAGACGAGGACACGTACTACCTGCAGGTGCGAGGCCGCGAGAACTTC 1250 
12 51 GAGATCCTGATGAAGCTGAAGGAGAGCCTGGAGCTGATGGAGTTGGTGCC 1300 

i«, ' * JL JL >JL 1 1 1 1 1 i 1 1 1 1 1 J 1 1 1 1 1 i 1 1 J f 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

12 51 GAGATCCTGATGAAGCTGAAGGAGAGCCTGGAGCTGATGGAGTTGGTGCC 1300 
1301 GCAGCCGCTGGTAGACTCCTATCGGCAGCAGCAGCAGCTCCTACAGAGGC 1350 
1301 GCAGCCGCTGGTAGACTCCTATCGGCAGCAGCAGCAGCTCCTACAGAGGC 1350 

13 51 CGAGTCACCTACAGCCCCCATCCTACGGGCCGGTCCTCTCGCCCATGAAC 1400 
" rrioiiUiii ' I I I I I I I I'l I I I I.I I I I I M I |.| | | | | | | | | | | | | | | | 

13 51 CGAGTCACCTACAGCCCCCATCCTACGGGCCGGTCCTCTCGCCCATGAAC 1400 

_ 1401 AAGGTGCACGGGGGCGTGAACAAGCTGCCCTCCGTCAACCAGCTGGTGGG 1450 
" uni iUiivlii' ' 1 M I M II I I I I I I I I I I I I I I I I I I I I I I III I I I I I I | 

1401 AAGGTGCACGGGGGCGTGAACAAGCTGCCCTCCGTCAACCAGCTGGTGGG 1450 

1451 CCAGCCTCCCCCGCACAGCTCGGCAGCTACACCCAACCTGGGACCTGTGG 1500 

i«i JJ. I JLJULJJL I II 1 1 i 1 1 I M i 1 1 I M M i 1 1 M 1 1 1 1 M M 1 1 M 1 1 M M 

— 14 51 CCAGCCTCCCCCGCACAGCTCGGCAGCTACACCCAACCTGGGACCTGTGG 1500 

_ 1501 GCTCTGGGATGCTCAACAACCACGGCCACGCAGTGCCAGCCAACAGCGAG 1550 

i ««n lULUJiLIJiJLU 1 1 1 1 N I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I 

1501 GCTCTGGGATGCTCAACAACCACGGCCACGCAGTGCCAGCCAACAGCGAG 1550 

_ 1551 ATGACCAGCAGCCACGGCACCCAGTCCATGGTCTCGGGGTCCCACTGCAC 1600 
i«, I JJUJUI A I I I M I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1551 ATGACCAGCAGCCACGGCACCCAGTCCATGGTCTCGGGGTCCCACTGCAC 1600 

1601 TCCGCCACCCCCCTACCACGCCGACCCCA^CTCGTCAGTTTTTTAACAG 1650 

icni MINN IMM I IN I MINIMI MINIM III 

1601 TCCGCCACCCCCCTACCACGCCGACCCCAGCCTCGTC 1637 



FIG. 3 

17 51 GATCCCCGAGCAGTATCGCATGACCATCTGGCGGGGCCTGCAGGACCTGA 1800 t 
I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I ^ Wl 1 L « 



1701 AGCATTTACCACCTGCAGAACCTGACCATCGAGGACCTGGGGGCCCTGAA 1750 

I I I I Mill I I I I I IMI I 
163 8 AGGACCTGGGGGCCCTGAA 1656 
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1657 GATCCCCG AGCAGTATCGCATGACCATCTGGCGGGGCCTGCAGGACCTGA 1706 
1801 AGCAGGGCCACGACTAC(^ 1850 
1707 AGCAGGGCCACGACTACGGCGCCGCCGCGCAGCAGCTGCTCCG<^CCAGC 1756 
1851 ^^99^*^^^^^*yy^CCA7^GGCGGCTCCGGGGAGCTGCAGCGCCAGCG 1900 

1 ilJUJUU.II 1 ! I 1 I I I I I I I I I I I I | | | | | | | | | | | | | | | I I I | I | | | ! | 

17 57 AACGCGGCCGCCATTTCCATCGGCGGCTCCGGGGAGCTGCAGCGCCAGCG 1806 

1901 OTTCATTCAGGCCGTGCACTTCCGCGTGCGCCACACCATCACCATCCCCA 1950 

1807 GGTCATGGAGGCCGTGCACTTCCGCGTGCGCCACACCATCACCATCCCCA 1856 

1951 accgcggcg<k:cccggcgccggccccgacgagtgggcggacttcggcttc 2000 

.„,, N 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 mumTm 

1857 ACCGCGGCGGCCCCGGCGCCGGCCCCGACGAGT(^CGGACTTCGGC^ 1906 
2001 GACCTGCCCGACTGCAAGGCCCGCAAGCAGCCCATCAAGGAGGAGTTCAC 2050 

1907 ^i^UJUXUiJUJL M N 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 III I Ml ! I 

1907 GACCTGCCCGACrcCAAGGCCCGCAAGCAGCCCATCAAGGAGGAGTOTAC 1956 
2051 TCAGGCCGAGATCCACTGAGGGGCCGGGCCCAGCCAGAGCCTGTGCCACC 2100 

, oe , UHI'IIMIIIIINIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIl 

1957 GGAGGCCGAGATCCACTGAGGGCKTCGGGCCCA^ 2006 
2101 GCCCAGAGACCCAGGCCGCCTCGCTCTC 2128 

I M 1 1 1 1 1 1 1 M 1 1 f M 1 1 M 1 1 1 1 1 M 

2007 GCCCAGAGACCCAGGCCGCCTCGCTCTC 2034 



FIG.3cont. 
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330 
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350 
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370 
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390 
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410 
1441 
430 
1501 
450 
1561 
470 
1621 
490 



TGCCTCCCCGCCCGCGCACCCGCCCCGAGGCCTGTGCTCCTGCGAAGGGGACGCAGCGAA 60 
GCCGGGGCCCGCGCCAGGCCGGCCGGGACGGACGCCGATGCCCGGAGCTGCGACGGCTGC 120 
AG AGCG AGC TGC CC TCGG AGGCCGGTGTG AGG AAG ATGG CC C AGTC C ACC ACC AC CT CC C 180 

MAQSTTTSP 9 
CCG ATGGGGGCACCACGTTTGAGCACCTCTC^AGCTCTCTGGAACCAGACAGCACCTACT 240 

DGGTTFEHLWSSLEPDSTYF 29 

TCGACCTTCCCCAGTCAAGCCGGGGGAATAATGAGGTGGTGGGTGGCACGGATTCCAGCA 300 

DLPQSSRGNNEVVGGTDSSM 49 

TGGACGTCTTCCACCTAGAGGGCATGACCACATCTGTCATGGCCCAGTTC AATTTGCTGA 3 60 

DVFHLEGMTTSVMAQFNLLS 69 

GCAGCACCATGGACCAGATGAGCAGCCGCGCTGCCTCGGCCAGCCCGTACACCCCGGAGC 420 

STMDQMS-SRAASAS PYT PEH 89 

ACGCCGCCAGCGTGCCCACCCATTCACCCTACGCACAGCCCAGCTCCACCTTCGACACCA 480 

AASVPTHSPYAQPSSTFDTM 109 

TGTCGCC CGCGCCTG TC ATCCCCTCC AAC ACCG ACT ATC C CGG AC C C C ACC ACTTCG AGG 540 

SPAPVIPSNTDYPGPHHFEV 129 

TCACTTTCCAGCAGTCCAGCACGGCCAAGTCAGCCACCTGGACGTACTCCCCACTCTTGA 600 

TFQQSSTAKSATWTYSPLLK 149 

AG AAACTCTACTGCCAGATCGCCAAGACATGCCCCATCCAGATCAAGGTGTCCGCCCCAC 660 

KLYCQIAKTCPIQIKVSAPP 169 

CGCCCCCGGGCACCGCCATCCGGGCCATGCCTGTCTACAAGAAGGCGGAGCACGTGACCG 720 

PPGTAI RAMPVYKKAEHVTD 189 

ACATCGTG AAGCGCTGCCCC AACCACGAGCTCGGGAGGGACTTCAACGAAGGAC AGTCTG 7 80 

IVKRCPNHELGRDFNEGQSA 209 

CCCCAGCCAGCC ACCTC ATCCGTGTGGAAGGCAATAATCTCTCGCAGTATGTGGACGACC 840 

PASHLI RVEGNNLSQYVDDP 229 

CTGTCACCGGCAGGCAGAGCGTCGTGGTGCCCTATGAGCCACCACAGGTGGGGACAGAAT 900 

VTGRQSVVVPYEPPQVGTEF 249 

TCACCACCATCCTGTACAACTTCATGTGTAACAGCAGCTGTGTGGGGGGCATGAACCGAC 960 

TTILYN.FMCNSSCV GGMNRR 269 

GGCCCATCCTCATCATCATCACCCTGGAGACGCGGGATGGGCAGGTGCTGGGCCGCCGGT 1020 

P I L I I I T L E TRDGQVLGRRS 289 

FEGR ICACPGRDRKAD E*^^?^ 309° 

ACCGGGAGCAGCAGGCCTTGAATG AGAGCTCCGCCAAG AACGGGGCTGCCAGC AAGCGCG 1140 

R'EQQALNESSAKNGAASKRA 329 

CCTTC AAGCAGAGTCCCCCTGCCGTCCCCGCCCTGGGCCCGGGTGTGAAGAAGCGGCGGC 1200 

FKQSPPAV PAL .G P, G V K K R R H 349 

ACGG AG ACGAGGAC ACGT ACTACCTGCAGGTGCG AGGCCGCG AGAACTTCG AG ATCCTGA 1260 

GDEDTYYLQVRGRENFE ILM 369 

TGAAGCTGAAGGAGAGCCTGGAGC1X^TGGAGTTGGTGCCGCAGCCGCTXX5TAGACTCCT 1320 

KLKESLELKELVPQPLVD SY 389 

ATCGGCAGCAGC AGCAGCTCCTACAGAGGCCGAGTCACCTACAGCCCCCATCCTACGGGC 1380 

RQQQQLLQRPSHLQPPSYGP 409 

CGGTCCTCTCGCCCATG AAC AAGGTGCACGGGGGCGTG AAC AAGCTGCCCTCCGTCAACC 1440 

V L S PMNKVHGGVNKLP S VNQ 429 

AGCTGGTJGGGCCAGCCTCCCCCGCACAGCTCGGCAGCTACACCCAACCTGGGACCTGTGG 1500 

LVGQ P PPHSSAATPNLG PVG 449 

GCTCTGGGATGCTCAACAACCACGGCCACGCAGTGCCAGCCAACAGCGAGATGACCAGCA 1560 

SGMLNNHGHAVPANSEMTSS 469 

GCCACGGCACCCAGTCCATGGTCTCGGGGTCCCACTGCACTCCGCCACCCCCCTACCACG 1620 

HGTQSMVSGSHCTPPPPYHA 489 

CCGACCCCAGCCTCGTCAGTTTTTTAACAGGATTGGGGTGTCCAAACTGCATCGAGTATT 1680 

DP SLVSFLTGLGCPNC I EYF 509 
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16 81 TCACGTCCCAGGGGTTACAGAGCATTTACCACCTGCAGAACCTGACCATCGAGGACCTGG 17 40 
510 TSQGLQS IYHLQNLTIEDLG 529 

17 41 GGGCCCTGAAGATCCCCGAGCAGTATCGCATGACCATCTGGCGGGGCCTGCAGGACCTGA 1800 
530 ALK I PEQYRMTIWRGLQ DLK 549 

1801 AGCAGGGCC ACG ACTACGGCGCCGCCGCGCAGCAGCTGCTCCGCTCCAGCAACGCGGCCG 1860 

550 QGHDYGAAAQQLLRSSNAAA 569 

1861 CC ATTTCC ATCGGCGGCTCCGGGGAGCTGC AGCGCCAGCGGGTCATGGAGGCCGTGC ACT 1920 

570 I S I GGSGELQRQRVMEAVHF 589 

1921 TCCGCGTGCGCC ACACC ATCACCATCCCCAACCGCGGCGGCCCCGGCGCCGGCCCCGACG 1980 

590 RVRHT ITI PNRGGPGAGPDE 609 

1981 AGTGGGCGGACTTCGGCTTCGACCTGCCCGACTGC AAGGCCCGC AAGCAGCCCATC AAGG 2040 

610 WAD.FGFDtiPDCKARKQPIK E 629 

2041 AGG AGTTC ACGG AGGCCG AG ATCCACTG AGGGGCCGGGC CC AGCC AG AGC CTGTGC CACC 2100 

630 EFTEAEIH* 649 

2101 GCCCAGAGACCCAGGCCGCCTCGCTCTCCTTCCTGTGTCC AAAACTGCCTCCGGAGGCAG 2160 

2161 GGCCTCC AGGCTGTGCCCGGGGAAAGGCAAGGTCCGGCCC ATGCCCCGGCACCTC ACCGG 2220 

2221 CCCCAGGAGAGGCCCAGCCACCAAAGCCGCCTGCGGACAGCCTGAGTCACCTGCAGAACC 2280 

2281 TTCTGGAGCTGCCCTAATGCTGGGCTTGCGGGGCAGGGGCCfeGCCCACTCTCAGCCCTGC 2 340 

2341 CACTGCCGGGCGTGCTCC ATGGCAGGCGTGGGTGGGGACCGCAGTGTCAGCTCCGACCTC 2 400 

2401 C AGGCCTC ATC CTAG AG ACTCTGTCATCTGCCGATC AAGC AAGGTC CTTCC AGAGGAAAG 2 460 

24 61 AATCCTCTTCGCTGGTGGACTGCCAAAAAGTATTTTGCGACATCirTTTGGTTCTGGAGAG 2 520 

2521 TGGTGAGC AGCCAAGCGACTGTGTCTGAAACACCGTGC ATTTTCAGGGAATGTCCCTAAC 2 580 

2581 GGGCTGGGGACTCTCrrcTGCTGGACTTGGGAGTGGCCTTTGCCCCCAGCACACTGTATTC 2640 

2641 TGCGGG ACCGC CTCCTTCCTGCCCCT AAC AACC ACC AAAGTGTTGCTGAAATTGGAGAAA 2700 

2701 ACTGGGG AAGGC GCAAC CCCTCCC AGGTGCGGGAAGCATCTGGT AC CGCCTCGGCC AGTG 2760 

2761 CCCCTCAGCCTGGCCACAGTCACCTCTCCTTGGGGAACCCTGGGCAGAAAGGGACAGCCT 2820 

2821 GTCCITAGAGGACCGGAAATTGTCAATATTTGATAAAATGATACCCTTTTCTAC 2874 



FIG. A cont. 
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1 TGCCTCCCCGCCCC^GOICCCGCCCCGAC^ 6 0 

6 1 GCCGGGGCCCGCGCCAGGCCGGCCGGGACGGACGCCGATGCCCGGAGCTGCGACGGCTGC 12 0 

121 AGAGCGAGCTGCCCTCGGAGGCCGGTGTGAGGAAGATGGCCCAGTCCACCACCACCTCCC 180 

"1° MAQSTTTSP 9 

181 CCGATGGGGGCACCACGTTTGAGCACCTCTGGAGCTCTCTGGAACCAGACAGCACCTACT 24 0 

10 DGGTTFEHLWSSLEPDSTYF 29 

2 41 TCG ACCTTC C C C AGTCAAGCCGGGGGAATAATGAGGTGGTGGGTGGCACGGATTCC AGC A 3 00 
30 DLPQSSRGNNEVVGGTDSSM 49 

3 01 TGGACGTCTTCCACCTAGAGGGCATGACCACATCTGTCATGGCCCAGTTCAATTTGCTGA 3 60 
50 DVFHLEGMTTSVMAQFNLLS 69 

3 61 GCAGCACCATGG ACCAGATGAGCAGCCGCGCTGCCTCGGCCAGCCCGTACACCCCGGAGC 420 
70 STMDQMSSRAASASPYTPEH 89 

4 21 ACGCCGCCAGCGTGCCC ACCCATTCACCCTACGCACAGCCCAGCTCCACCTTCGACACCA 4 80 
90 AASVPTHSPYAQPSSTFDTM 109 

4 81 TGTCGCCCGCGCCTGTCATCCCCTCCAACACCGACTATCCCGGACCCCACCACTTCGAGG 540 

110 SPAPVIPSNTDYPGPHHFEV 129 

541 TCACTTTCCAGC AGTCCAGCACGGCCAAGTCAGCCACCTGGACGTACTCCCCACTCTTGA 600 

130 TFQQSSTAKSATWTYSPLLK 149 

601 AGAAACTCTACTGCCAGATCGCCAAGACATGCCCCATCCAGATCAAGGTGTCCGCCCCAC 6 60 

150 KLYCQIAKTCPIQIKVSAPP 169 

661 CGCCCCCGGGCACCGCCATCCGGGCCATGCCTGTCTACAAGAAGGCGGAGCACGTGACCG 7 2 0 

170 P PGTA I RAMPVYKKAEHVTD 189 

721 AC ATCGTG AAGCGCTGCCCCAACCACGAGCTCGGGAGGGACTTCAACGAAGGACAGTCTG 7 80 

190 IVKRCPNHELGRDFNEGQSA 209 

7 81 CCCCAGCCAGCCACCTCATCCGTGTGGAAGGCAATAATCTCTCGCAGTATGTGGACGACC 840 

210 PASHLIRVEGNNLSQYVDDP 229 

841 CTGTC ACCGGC AGGC AG AGCGTCGTGGTGCCCTATGAGCCACCACAGGTGGGGAC AG AAT 900 

230 VTGRQSVVVPYEPPQVGTEF 249 

901 TC ACCACC ATCCTGTACAACTTCATGTGTAACAGCAGCTGTGTGGGGGGCATGAACCGAC 960 

250 TTILYNFMCNSSCVGGMNRR 269 

961 GGCCC ATCCTC ATCATCATCACCCTGGAGACGCGGGATGGGCAGGTGCTGGGCCGCCGGT 1020 

270 PILIIITLETRDGQVLGRRS 289 

1021 CCTTCG AGGGCCGCATCTGCGCCTGTCCTGGCCGCGACCGAAAAGCCGATGAGGACC ACT 1080 

290 FEGR ICACPGRDRKADEDHY 309 

1081 ACCGGG AGCAGC AGGC CTTG AATG AGAGCTCCGCC AAGAACGGGGCTGCCAGCAAGCGCG 1140 

310 REQQALNESSAKN GAASKRA 329 

1141 CCTTC AAGC AG AGTCCCCCTGCCGTCCCCGCCCTGGGCCCGGGTGTGAAG AAGCGGCGGC 1200 

330 FKQS PPAVPALGPGVKKRRH 349 

1201 ACGGAGACGAGGACACGTACTACCTGCAGGTGCGAGGCCGCGAGAACTTCGAGATCCTGA 1260 

350 GDEDTYYLQVRGRENFEILM 369 

1261 TGAAGCTGAAGGAGAGCCTGGAGCTGATGGAGTTGGTGCCGCAGCCGCTGGTAGACTCCT 1320 

370 KLKESLELMELVPQPLVDSY 389 

13 21 ATCGGCAGC AGC AGC AGCTCCT AC AGAGGCCGAGTCACCTACAGCCCCC ATCCTACGGGC 13 80 

390 RQQOQLLQRPSHLQPPSYGP 409 

13 81 CGGTCCTCTCGCCCATGAACAAGGTGCACGGGGGCGTGAACAAGCTGCCCTCCGTCAACC 14 40 

410 VLSPMNKVHGGVNKLPSVNQ 429 

1441 AGCTGGTGGGCCAGCCTCCCCCGCACAGCTCGGCAGCTACACCCAACCTGGGACCTGTGG 1500 

430 LVGQPPPHSSAATPNLGPVG 449 

1501 GCTCTGGGATGCTCAACAACCACGGCCACGCAGTGCCAGCCAACAGCGAGATGACCAGCA 1560 

450 SGMLNNHGHAVPANSEMTSS 469 

1561 GCCACGGCACCCAGTCCATGGTCTCGGGGTCCCACTGCACTCCGCCACCCCCCTACCACG 1620 

470 HGTQSMVSGSHCTPPPPYHA 489 

1621 CCrfACCCCAGCCTCGTCAGGACCTGGGGGCCCTGAAGATCCCCGAGCAGTATCGCATGAC 1680 

490 DPSLVRTWGP* 509 

1681 CATCTGGCGGGGCCTGCAGGACCTGAAGCAGGGCCACGACTACGGCGCCGCCGCGCAGCA 1740 

1741 GCTGCTCCGCTCCAGCAACGCGGCCGCCATTTCCATCGGCGGCTCCGGGGAGCTGCAGCG 1800 

1801 CCAGCGGGTCATGGAGGCCGTGCACTTCCGCGTGCGCCACACCATCACCATCCCCAACCG 1860 

18 61 CGGCGGCCCCGGCGCCGGCCCCGACGAGTGGGCGGACTTCGGCTTCGACCTGCCCGACTG 1920 

1921 CAAGGCCCGCAAGCAGCCCATCAAGGAGGAGTTCACGGAGGCCGAGATCCACTGAGGGGC 1980 

1981 CGGGCCCAGCCAGAGCCTGTGCCACCGCCCAGAGACCCAGGCCGCCTCGCTCTC 2034 
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1501 
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ACAGCGCCC AGTCCATGGTCTCGGGGTCCCACTGCACTCCGCCACCCCCCTACCACGCCG 1500 

SAQSMVSGSHCTPPPPYHAD 490 

ACCCCAGCCTCGTCAGTTTTTTAACAGGATTGGGGTGTCCAAACTGCATCGAGTATTTCA 156 0 

PS LVSFLTGLGCPNC I EYFT 510 

CCTCCCAAGGGTTACAGAGCATTTACCACCTGCAGAACCTGACCATTGAGGACCTGGGGG 1620 

SQGLQS IYHLQNLTIEDLGA 530 

CCCTGAAGATCCCCGAGCAGTACCGCATGACCATCTGGCGGGGCCTGCAGGACCTGAAGC 168 0 

L K I PEQYRMTIWRGLQDLKQ 550 

AGGGCCACGACTACAGC ACCGCGCAGCAGCTGCTCCGCTCTAGCAACGCGGCCACCATCT 174 0 

GHDYSTAQQLLRSSNAAT I S 570 

CCATCGGCGGCTCAGGGGAACTGCAGCGCCAGCGGGTCATGGAGGCCGTGCACTTCCGCG 1800 

IGGSGELQRQRVMEAVHFRV 590 

TGCGCCACACCATC ACCATCCCCAACCGCGGCGGCCCAGGCGGCGGCCCTGACGAGTGGG 1860 

RHTITI PN RGGPGGG PDEWA 610 

CGGACTTCGGCTTCGACCTGCCCGACTGCAAGGCCCGCAAGCAGCCCATCAAGGAGGAGT 192 0 

DFGFDLPDCKARKQPIKEEF 630 

TCACGGAGGCCGAGATCCACTGAGGGCCTCGCCTGGCTGCAGCCTGCGCCACCGCCCAGA 19 8 0 

T E A E I K * 650 

GACCCAAGCTGCCTCCCCTCTCCTTCCTGTGTGTCCAAAACTGCCTCAGGAGGCAGGACC 204 0 

TTCGGGCTGTGCCCGGGGAAAGGCAAGGTCCGGCCCATCCCCAGGCACCTCACAGGCCCC 2100 
AGGAAAGGCCCAGCCACCGAAGCCGCCTGTGGACAGCCTGAGTCACCTGCAGAACC 2156 




cont. 



THIS PAGE BLANK (uspto) 



WO 97/28186 



PCT7FR97/00214 



12/36 



60 

120 

180 

19 

240 



121 agcatctctatgg^cctctct^^ 

301 ^GCCGCCTGTCATCCC^ §§, 

111 fTTTTTTT^^ ;; 0 

481 CCCCCGCGCACGGCC^ J" 

140 r^r G f c c^p c T c " c r™^^ Ac r"ri^ A ^ G ^ c *°° 9 

SOI f^AGCCACC^^ J|» 

So ACCACC f CCTG ™^^ "J 

781 CCCATCCTTGTCAT^ j» 

841 ™»~«^™^^ |» 

901 ««*«"^ ^59 

^00 ^^ AC ^GGACATGp-CTACAT^ACGlXX:GAGGCCGGGAGAACTTTCAGATC^Arc 1080 

MO ^° TC ^^ A GCCTAGAACTGATGGAGCTTGTGCCCCAGCCTT^^ ll| 0 
J20 KVKESLELMELVPQ PLVD SY 

aio C GA ^ A ^ A ^ A GCAGCAGCAC^CCTACAGAGGCCGAGTCACCTGCAGCCTCC^TCCTAT lioO 

j«u k q q q q q q L L QRPS HLQPPSY *«;o 

1201 ^CCCC^CTCCCCAATCA,^^ | 0 

iS ^^^^ " 20 

X 400 A ' I ^^^^^^^G < ^A' rc CTCAACAGCCACGGCCACAGCATGCCGGCCAATGGTGAGATGA^T "J 0 

,uy MG SGMLN SHGHSMPANGEMN aio 

GGAG / 3C 5 ACAGCTCCCAGA CCATGGTTTCGGGATCCCACTGCACCCCGCCACCCCCCTAT 1440 

420 GGHSSQTMVSGSHCTPPPpv 439 

tin ^^^ C ^^^ l ^^^^^^^^'^^*^^r^GACAGGGTTGGGGT&rCCAAHCTGCA'TCGlLG 1500 

l 52Jt TGCTO^CTTCCCAAGTOTTGCAGAGCATCT {5^ 

460 CFTSQGLQSIYHLQNLTIED 47<J 

1561 CTTOGGGCTt^^ ielo 

480 LGALKVPDQYRMTIWRGLOD 499 

tin f TC ^^ AG ACXTCATGACTGCGCX:CACX:AACTGCTACCXr^^ X680 

bOO LKQSHDCGQQLLRSSSNAAT 519 

c 5 n A ^ CCATC ^CGGCTCTGGCGAGCTGCAGC^ 1740 

SJU I S IGGSGELQRQRVMEAVHF 539 

£ G ^^ GC £ ACACC ^^ 1800 

b40 RVRHT IT I PNRGGAGAVTGP 559 

GACGAGTCX^CGGACTTTGGCTTTGACCTCXrC^ iggQ 

560 DEWADFGFDLPDCKSRKQPI 579 

580 ^g AG ^ AG ^ CACA ^ x 9 2 0 

1921 CTCTGTGAGAAACTGCTCTTGGAAGTGCK3A i|o0 

1981 GGACCTTCTGCCGGATGCCATTCCTGAAGGGAAGTCGCTCATGAACT 2 040 

FIG.7 
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1 TGGTCCCGCTTCGACCAAGACTCCGGCTACCAGCTTGCGGGCCCCGCGGAGGAGGAGACC 6 0 

6 1 CCGCTGGGGCTAGCTGGGCGACGCGCGCCAAGCGGCGGCGGGAAGGAGGCGGGAGGAGCG 120 

121 GGGCCCGAGACCCCGACTCGGGCAGAGCCAGCTGGGGAGGCGGGGCGCGCGTGGGAGCCA 180 

181 GGGGC CCGGGTGGCCGGCCCTCCTCCGCCACGGCTGAGTGCCCGCGCTGCCTTCCCGCCG 24 0 

2 41 GTCCGCCAAGAAAGGCGCTAAGCCTGCGGCAGTCCCCTCGCCGCCGCCTCCCTGCTCCGC 300 

3 01 ACCCTTATAACCCGCCGTCCCGCATCCAGGCGAGGAGGCAACGCTGCAGCCCAGCCCTCG 360 

3 61 CCGACGCCGACGCCCGGCCCGGAGCAGAATGAGCGGCAGCGTTGGGGAGATGGCCCAGAC 420 
-8 MSGSVGEMAQT 11 

4 21 CTCTTCTTCCTCCTCCTCC ACCTTCGAGCACCTGTGGAGTTCTCTAGAGCCAGACAGCAC 4 80 
12 SSSSSSTFEHLWSSLEPDST 31 

481 CT ACTTTG ACCTC C CCC AGCC C AGCC AAGGGACT AGCG AGGC ATC AGGC AGCGAGG AGTC 540 

32 YFDLPQP-SQGTSEASGSEES 51 

541 CAACATGGATGTCTTCCACCTGCAAGGCATGGCCCAGTTCAATTTGCTCAGCAGTGCCAT 600 

52 NMDVFHLQGMAQFNLLS SAM 71 

601 GGACCAGATGGGCAGCCGTGCGGCCCCGGCGAGCCCCTACACCCCGGAGCACGCCGCCAG 660 

72 DQMGSRAAPASPYTPEHAAS 91 

661 CGCGCCCACCC ACTCGCCCT ACGCGC AGCCCAGCTCCACCTTCGACACCATGTCTCCGGC 7 20 

92 APTHSPYAQPSSTFDTMSPA 111 

7 21 GCCTGTC ATCCCTTCCAATACCGACTACCCCGGCCCCC 7 58 

112 PVIPSNTDYPGP 123 
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_ Name : 


sr 


-p70a~cos3 


Len : 


650 


Check : 


9661 


Weight : 


1 


00 


_ Name : 


sr 


-p70b-cos3 


Len : 


650 


Check : 


3605 


Weight: 


1 


00 


_ Name : 


sr 


-p70-ht29 


Len : 


650 


Check: 


85 


Weight: 


1 


00 


_ Name : 


sr 


-p70c-att20 


Len : 


650 


Check: 


4072 


Weight .- 


1 


00 


_ Name : 


sr 


-p70a-act20 


Len : 


650 


Check: 


4204 


Weight : 


1 


00 



I 1 50 

_ sr-p70a-cos3 MAQ STTTSPDGGT TFEHLWSSLE PDSTYFDLPQ S S RGNNEWG 

_ sr-p70b-cos3 MAC STTTSPDGGT TFEHLWSSLE PDSTYFDLPQ S S RGNNEWG 

sr-p70-ht2 9 MAC STATSPDGGT TFEHLWSSLE PDSTYFDLPQ S S RGNNEWG 

_sr-p70c-att20 

_sr-p7 0a-att2 0 MSGSVGEMAQ . . .TSSSSSS TFEHLWSSLE PDSTYFDLPQ PSQGTSEASG 

51 100 

_ sr-p70a-cos3 GTDSSMD.VF HLEGMTTSVM AQFNLLSSTM DQMSSRAASA SPYTPEHAAS 

_ sr-p70b-cos3 GTDSSMD.VF HLEGMTTSVM AQFNLLSSTM DQMSSRAASA SPYTPEHAAS 

_ sr-p70-ht2 9 GTDSSMD.VF HLEGMTTSVM AQFNLLSSTM DQMSSRAASA SPYTPEHAAS 

_sr-p7 0c-att20 . . . MCMGPVY . . ESLG . . .Q AQFNLLSSAM DQMGSRAAPA SPYTPEHAAS 

_sr-p7 0a-att2 0 SEESNMD - VF HLQGM AQFNLLSSAM DQMGSRAAPA SPYTPEHAAS 

I 101 150 

_ sr-p70a-cos3 VPTHSPYAQP SSTFDTMSPA PVIPSNTDYP GPHHFEVTFQ QSSTAKSATW 

_ sr-p7 0b-COs3 VPTHSPYAQP SSTFDTMSPA PVIPSNTDYP GPHHFEVTFQ QSSTAKSATW 

_ sr-p70-ht29 VPTHSPYAQP SSTFDTMSPA PVIPSNTDYP GPHHFEVTFQ QSSTAKSATW 

_sr-p70c-att20 APTHSPYAQP SSTFDTMSPA PVIPSNTDYP GPHHFEVTFQ QSSTAKSATW 

_sr-p70a-att20 APTHSPYAQP SSTFDTMSPA PVIPSNTDYP GP 

~ 151 200 

_ sr-p70a-cos3 TYSPLLKKLY CQIAKTCPIQ IKVSAPPPPG T A I RAMPVYK KAEHVTDIVK 

_ sr-p70b-cos3 TYSPLLKKLY CQIAKTCPIQ IKVSAPPPPG TAIRAMPVYK KAEHVTDIVK 

_ sr-p7 0-ht29 TYSPLLKKLY CQIAKTCPIQ IKVSTPPPPG TAIRAMPVYK KAEHVTDWK 

_sr-p70c-att20 TYSPLLKKLY CQIAKTCPIQ IKVSTPPPPG TAIRAMPVYK KAEHVTDIVK 

„sr-p70a-att20 



_ sr-p70a-cos3 
_ sr-p70b-cos3 
_ sr-p70-ht29 
_sr-p70c-att20 
_sr-p70a-att20 



201 250 

RCPNHELGRD FNEGQSAPAS HLIRVEGNNL SQYVDDPVTG RQSVWPYEP 

RCPNHELGRD FNEGQSAPAS HLIRVEGNNL SQYVDDPVTG RQSVWPYEP 

RCPNHELGRD FNEGQSAPAS HLIRVEGNNL SQYVDDPVTG RQSVWPYEP 

RCPNHELGRD FNEGQSAPAS HLIRVEGNNL AQYVDDPVTG RQSVWPYEP 



_ sr-p70a-cos3 
_ sr-p70b-cos3 
_ sr-p70-ht29 
.sr-p70c-att20 
_sr-p70a-att20 



251 t - : 300 

PQVGTEFTTI LYNFMCNSSC VGGMNRRPIL I IITLETRDG QVLGRRSFEG 

PQVGTEFTT I LYNFMCNSSC VGGMNRRPIL I IITLETRDG QVLGRRSFEG 

PQVGTEFTTI LYNFMCNSSC VGGMNRRPIL IIITLEMRDG QVLGRRSFEG 

PQVGTEFTTI LYNFMCNSSC VGGMNRRPIL VI ITLETRDG QVLGRRSFEG 



_ sr-p70a-cos3 
_ sr-p70b-cos3 
_ sr-p70-ht29 
_sr-p70c-att20 
_sr-p70a-att20 



301 350 
RICACPGRDR KADEDHYREQ QALNESSAKN GAASKRAFKQ SPPAVPALGP 
RXCACPGRDR KADEDHYREQ QALNESSAKN GAASKRAFKQ SPPAVPALGP 
RICACPGRDR KADEDHYREQ QALNESSAKN GAASKRAFKQ SPPAVPALGA 
RICACPGRDR KADEDHYREQ QALNESTTKN GAASKRAFKQ SPPAIPALGT 
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sr-p70a-cos3 
sr-p70b-cos3 
" sr-p70 -ht29 
_sr-p70c-att20 
_sr-p70a-att20 



sr-p70a-cos3 
sr-p70b-cos3 
sr-p70-ht29 
~sr-p70c-att20 
_sr-p70a-att20 



351 



400 



GVKKRRHGDE DTYYLQVRGR ENFEILMKLK ESLELMELVP QPLVDSYR . . 
GVKKRRHGDE DTYYLQVRGR ENFEILMKLK ESLELMELVP QPLVDSYR . . 
GVKKRRHGDE DTYYLQVRGR ENFEILMKLK ESLELMELVP QPLVDSYR . . 
NVKKRRHGDE DMFYMHVRGR ENFEILMKVK ESLELMELVP QPLVDSYRQQ 

401 450 
QQQQLLQRPS HLQPPSYGPV LSPMNKVHGG VNKLPSVNQL VGQPPPHSSA 
QQQQLLQRPS HLQPPSYGPV LSPMNKVHGG VNKLPSVNQL VGQPPPHSSA 
QQQQLLQRPS HLQPPSYGPV LSPMNKVHGG MNKLPSVNQL VGQPPPHSSA 
QQQQLLQRPS HLQPPSYGPV LSPMNKVHGG VNKLPSVNQL VGQPPPHSSA 



451 500 
sr-p70a-cos3 ATPNLGPVGS GMLNNHGHAV PANSEMTSSH GTQSMVSGSH CTPPPPYHAD 
" sr-p70b-cos3 ATPNLGPVGS GMLNNHGHAV PANSEMTSSH GTQSMVSGSH CTPPPPYHAD 
sr-p70-ht29 ATPNLGPVGP GMLNNHGHAV PANGEMSSSH SAQSMVSGSH CTPPPPYHAD 
Isr-p70c-att20 AGPNLGPMGS GMLNSHGHSM PANGEMNGGH SSQTMVSGSH CTPPPPYHAD 
_sr-p70a-att20 

501 550 
Sr-p70a-cos3 PSLVSFLTGL GCPNCIEYFT SQGLQSIYHL QNLTIEDLGA LK I PEQYRMT 

sr-p70b-cos3 PSLVR..T.W G.P 

sr-p70-ht29 PSLVSFLTGL GCPNCIEYFT SQGLQSIYHL QNLTIEDLGA LKI PEQYRMT 
_sr-p70c-att20 PSLVSFLTGL GCPNCIECFT SQGLQSIYHL QNLTIEDLGA LKVPDQYRMT 
Isr-p70a-att20 - • : -/ 

551 " " ' 600" 

I sr-p70a-cos3 IWRGLQDLKQ GHDYGAAAQQ LLR . SSNAAA ISIGGSGELQ RQRVMEAVHF 

sr-p70b-cos3 

Sr-p70-ht29 IWRGLQDLKQ GHDYS . TAQQ LLR . SSNAAT ISIGGSGELQ RQRVMEAVHF 
Isr-p70c-aCt20 IWRGLQDLKQ SHDCG. . . QQ LLRSSSNAAT ISIGGSGELQ RQRVMEAVHF 
_sr-p70a-att20 ; 

601 650 
Z sr-p70a-cos3 RVRHTITIPN RGGPGA. .GP DEWADFGFDL PDCKARKQPI KEEFTEAEIH 

sr-p70b-cos3 

Sr-p70-ht29 RVRHTITIPN RGGPGG..GP DEWADFGFDL PDCKARKQPI KEEFTEAEIH 
_sr-p70c-att20 RVRHTITIPN RGG AG A VTG P DEWADFGFDL PDCKSRKQPI KEEFTETESH 
_sr-p70a-att20 
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2 < [ > 3 

1 MAQS . . TATSPDGGTTFEHLWSSLEPDSTYFDLPQSSRGNNEWGGTDSSMD 50 

I I II I! I II , || 

^ MEEPQSDPSVEPPLSQETFS DLW^LLP E N WL|5PLP SQAMD 41 

51 VFHLEGMTTSVM^Q^NLLSSTMDQMSSRAASASPYTPEHAASVPTHSPYA 100 

I I I I I I II I I 

4 2 DLML . . . SPDDIEQWFTEDPGPDEAPRMPEAAPPVAPAPAAPTPA . APAP 87 

101 QPSSTFDTMSPAPVIPSNTDYPGPHHFEVTFQQSSTAKSATWTjY^LLKK 150 

II M M I I I MM I I.M I I I 

8 8 APSWPL S S SVPSQKTYQGS YGFRLGFLHSGTAKSVTCTTYS PALNK 132 

. < 1 > 5 

151 LYCQIAKTCPIQIKVSTPPPPGTAIRAMPVYKKAEHVTDWKRC PNHELG 2 00 

II Mill I I Mill III II I I || Ml || 

133 MFCQLAKTCPVQLVA/DSTPPPGTRVRAMAIYKQSQHMTEVVRRCPHHE . . 180 

2 01 RDFNEGQSAPASHLIRVEGNNLSQYVDDPVTGRQSVVVPYEPPQWGTEFT 250 

I M III Mill Ml I I I MUM II ill I 

181 RCSDSDGLAPPQHLIRVEGNLRVEYLDDRNTFRHSVWPYEPPEkrGSDCT 230 
251 T I L YNFMCNS S CVGGMNRRP I L 1 1 1 TL EMRDGQVLGRRS FEGRI CAC PGR 300 

M I! MUM 1 1 E f I ! I 1 1 Mill I III III I MUM 
231 t i h ynymcn s s cmggmnrrp i lt 1 1 tl eds s gn l lgrns f e vrvc ac pgr 280 

3 01 drkadedhyreqqai^essakngaaskrAfkqsppavpalgagvkkrrhg 3 50 

II I I III I I 

2 81 DRRTEEENLRKKGEPHHELP . . PGSTKRALPNNTSSSPQ PKKKPL 3 23 

< ■ > 10 < ■> 9 < i ■> 11 

351 DEDTYYLQl^GRENFEILMKLKESLELMELVPQPLVDSYRQQQQLLQRPS 400 

I 11,1111 II I I III II 

324 DG EYFTLQIERGRERFEMFRELNEALELKDAQAGKEPGGSRAHSSHLKSKK 373 

< '> *0 • < 7 V } > 12 
401 HLQPPSYGPVLSPMNKVHGGMNKLPSVNQLVGQPPPHSSAATPNLGPVGP «450 

374 GQSTSRHKKLMFKTEGPDSD 393 

< | > 13 

451 GMLNNHGHAVPANGEMSSSHSAQSMVSGSHCTPPPPYHADPSLVSFLTGL 500 



^14 



501 GCPNCIEYFTSQGLQSIYHLQNLTIEjDLGALKIPEQYRMTIWRGLQDLKQ 550 
551 GHDYSTAQQLLRSSNAATISIGGSGELQRQRVMEAVHFRVRHTITIPNRG 600 
601 GPGGGPDEWADFGFDLPDCKARKQPIKEEFTEAEIH 63 6 



FIG. 12 
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sr-p70d-imr32 
sr-p70a-ht29 



CG ACCTTCCCCA GTCAAGCCGG GGGAATAATG 3 2 
CG ACCTTCCCCA GTCAAGCCGG GGGAATAATG 150 



AGGTGGTGGG CGGAACGGAT TCCAGCATGG ACGTCTTCCA CCTGGAGGGC 82 
AGGTGGTGGG CGGAACGGAT TCCAGCATGG ACGTCTTCCA CCTGGAGGGC 2 00 

ATGACTACAT CTGTCATGCA TCCTCGGCTC CTGCCTCACT AGCTGCGGAG 132 



CCTCTCCCGC TCGGTCCACG CTGCCGGGCG GCCACGACCG TGACCCTTCC 182 



CCTCGGGCCG 


CCCAGATCCA 


TGCCTCGTCC 


CACGGGACAC 


CAGTTCCCTG 


232 


GCGTGTGCAG 


ACCCCCCGGC 


GCCTACCATG 


CTGTACGTCG 


GTGACCCCGC 


282 


ACGGCACCTC 


GCCACGGCCC 
GGCCC 


AGTTCAATCT 
AGTTCAATCT 


GCTGAGCAGC 
GCTGAGCAGC 


ACCATGGACC 
ACCATGGACC 


332 
252 


AGATGAGCAG 
AGATGAGCAG 


CCGCGCGGCC* 
CCGCGCGGCC 


TCGGCCAGCC 
TCGGCCAGCC 


CCTACACCCC 
CCTACACCCC 


AGAGCACGCC 
AGAGCACGCC 


382 
302 


GCCAGCGTGC 
GCCAGCGTGC 


CCACCCACTC 
CCACCCAcTC 


GCCCTACGCA 
GCCCTACGCA 


CAACCCAGCT 
CAACCCAGCT 


CCACCTTCGA 
CCACCTTCGA 


432 
352 


CACCATGTCG 
CACCATGTCG 


CCGGCGCCTG 
CCGGCGCCTG 


TCATCCCCTC 
TCATCCCCTC 


CAACACCGAC 
CAACACCGAC 


TACCCCGGAC 
TACCCCGGAC 


482 
402 


CCCACCACTT 
CCCACCACTT 


TGAGGTCACT 
TGAGGTCACT 


TTCCAGCAGT 
TTCCAGCAGT 


CCAGCACGGC 
CCAGCACGGC 


CAAGTCAGCC 
CAAGTCAGCC 


532 
452 


ACCTGGACGT 


ACTCCCCGCT 


CTTGAAG 









ACCTGGACGT ACTCCCCGCT CTTGAAG 



ATGACTACAT CTGTCAT 



217 
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I. Basis of the report 



1 . This report has been drawn on the basis of (Replacement sheets which have been furnished to the receiving Office in response to an invitation 
under Article 14 are referred to in this report as "originally filed" and are not annexed to the report since they do not contain amendments.): 



[ | the international application as originally filed. 

the description, pages 1 ~ 7 % 

pages 

pages 

pages 



, as originally filed, 
, filed with the demand, 
, filed with the letter of 
, filed with the letter of 



El 



the claims, 



Nos. 
Nos. 
Nos. 
Nos. 
Nos. 



1 - 12, 17-36 



13 - 16 



, as originally filed, 

, as amended under Article 1 9, 

, filed with the demand, 
, filed with the letter of 
. filed with the letter of 



26 August 1998 (26.08.1998) 



| | the drawings, sheets/fig 
sheets/fig 
sheets/fig 
sheets/fig 



, as originally filed, 
, filed with the demand, 
, filed with the letter of 
, filed with the letter of 



2. The amendments have resulted in the cancellation of: 

I | the description, pages 

I 1 the claims, Nos. 

I 1 the drawings, sheets/fig 



3 I 1 This report has been established as if (some of) the amendments had not been made, since they have been considered 
— to go beyond the disclosure as filed, as indicated in the Supplemental Box (Rule 70.2(c)). 

4. Additional observations, if necessary: 
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International application No. 


INTERNATIONAL- PRELIMINARY EXAMINATION REPORT 
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V. Reasoned statement under Article 35(2) with regard to novelty, inventive step or industrial applicability; 
citations and explanations supporting such statement 



1 . Statement 



Novelty (N) 


Claims 


1-6, 


8 - 12, 15 - 


36 


YES 




Claims 




I, 13, 14 




NO 


Inventive step (IS) 


Claims 


1-6, 


8 - 12, 15 - 


36 


YES 




Claims 




7, 13, 14 




NO 


Industrial applicability (LA) 


Claims 


1 - 


18, 20 - 36 




YES 




Claims 


19 


(no opinion) 




NO 


Citations and explanations 












1) For the following 


reasons, 


Claims 


7, 13 and 14 


do 


not 



appear to satisfy the requirement of PCT Article 33(2): 



Since the sequences defined in point k of Claim 7 and the 
probes or primers defined in Claim 13 do not have a 
minimum length, they may possibly be very short sequences 
composed, for example, of only three nucleotides. Such 
sequences, which are certainly known, can hybridize with 
the sequences described in the application, whether or not 
the hybridization conditions are stringent. 



Moreover, even disregarding the question of length, the 
feature introduced by the Applicants into Claim 13 that 
hybridization has to take place in stringent conditions 
does not appear sufficient to delimit the claimed probes 
or primers clearly over those described in the documents 
cited in the international search report against the 
novelty of Claims 13 and 14. Indeed, the meaning of the 
term "stringent conditions" is very broad and in no way 
implies that a precise minimum level of homology is 
necessary for hybridization to take place between two 
sequences. 
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Therefore the novelty of Claims 7, 13 and 14 cannot be 
recognized (cf. also point 4 below). 

2) The subjects of Claims 1 to 6, 8 to 12 and 15 to 36 do 
not appear to be described or suggested by the prior art 
as defined in the Regulations (PCT Rule 64.1 to 64.3) as a 
solution to the problem of providing nucleotide sequences 
of the family of tumour-suppressor genes having 
prophylactic, therapeutic and diagnostic uses in the field 
of pathologies associated with apoptosis and cellular 
transformation phenomena. 

Claims 1 to 6, 8 to 12 and 15 to 36 therefore appear to 
satisfy the requirements of PCT Article 33(2) and (3) 
(cf., however, point 4 below). 

3) Claims' l,!.to : 18 arid 20. to 36 appear to have industrial 
applicability pursuant to PCT Article 33(4). The PCT 
contains no uniform criteria for assessing the industrial 
applicability of Claim 19. Patentability may also depend 
on the wording of the claims. The EPO does not, for 
example, recognize the industrial applicability of claims 
to the use of a compound in a medical treatment; it does, 
however, allow claims to the first use of a known compound 
in a medical treatment or to the use of such a compound to 
manufacture a drug for a new medical treatment. 
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VUL Certain observations on the international application 

The following observations on the clarity of the claims, description, and drawings or on the question whether the claims are fully 
supported by the description, are made: 

4) The expression "any biologically activated sequence 
derived from SEQ ID. No. ..." in Claim 1 is unclear (PCT 
Article 6) since the nature of the biological activity and 
the manner in which the sequence is derived from the 
sequences listed in the claim are not specified. 
Furthermore, any sequence of any known protein having any 
biological activity could be considered to be "derived" 
from the sequences in Claim 1. 

This objection for lack of clarity also applies to the 
definition given in the final part of Claim 7. Here too, 
all known nucleotide sequences can be considered to 
satisfy the definition given there. 

5) Although the term "pSEl" used in Claim 10 is also used 
in another application (cf. page 10, line 12), this 
appears to be an in-house name which, as such, does not 
give the person reading the claim any technical 
information. Therefore Claim 10 is unclear (PCT Article 

6) . The same also applies to the use of the in-house name 
"SR-p70" in Claims 25, 28 to 32, 25 and 36. 

6) Contrary to the requirements of PCT Article 6, Claims 
19 and 20 are not supported by the description since the 
efficiency of the claimed sequences in gene therapy has 
not been demonstrated. 
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